1、2022 第二十四卷 第十一期 Vol.24 No.11 Modernization of Traditional Chinese Medicine and Materia Medica-World Science and Technology 基于数据挖掘和网络药理学的左右半结肠癌中医组方用药规律差异及作用机制研究庄振杰1,谢静怡1,朱泳1,罗丽霞1,刘展华2(1.广州中医药大学第一临床医学院 广州 510405;2.广州中医药大学第一附属医院 广州 510405)摘要:目的基于数据挖掘和网络药理学方法分析左、右半结肠癌临床组方用药规律及作用机制,为中医防治左右半结肠癌提供指导。方法基于广州
2、中医药大学第一附属医院2017年1月1日至2020年6月30日住院结肠癌患者施治方药信息,使用数据挖掘关联规则及聚类分析等算法,研究中医组方规律;使用网络药理学方法研究核心关联规则药物的成分、靶点及涉及的基因本体结果与京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路,阐明其作用机制。结果共纳入383首方药信息,左半结肠癌使用典型药物为48味,右半结肠癌味57味,两者共同使用典型药物44味。左半结肠癌典型方药“半枝莲-法半夏-陈皮”抗癌关键成分主要包括:麻黄素、-氨基丁酸及葫芦巴碱等;作用核心靶点包括:ESR1、FASLG、
3、KITLG等;抗癌作用机制发挥涉及的主要的生物学过程包括氧水平反应、肽链内切酶活性调节及凋亡信号通路调控,涉及的信号通路主要有MAPK信号通路、RAS信号通路及PI3K-AKT信号通路。右半结肠癌典型方药“地榆-生甘草-槐花”抗癌的关键成分主要包括:白桦脂醇、延胡索乙素及熊果酸;作用核心靶点主要包括:IFNG、MAPK3、PTGS2;抗癌作用机制发挥涉及的主要的生物学过程包括:类固醇代谢过程、防御反应的正向调控及炎症反应的正向调控;涉及的通路主要包括:IL-17信号通路、VEGF信号通路及TNF信号通路。结论中医治疗左右半结肠癌的用药规律存在一定差异。左半结肠癌方药以清热解毒、行气活血为特点,
4、右半结肠癌则以健脾益气,养血补血为特点。左右半结肠癌的典型方药可通过多成分-多靶点-多通路的作用特点起到防治结肠癌的作用,研究结果可为中医论治左右半结肠癌的临床实践及基础研究提供参考。关键词:数据挖掘 左右半结肠癌 关联规则 聚类分析 网络药理学doi:10.11842/wst.20210804012 中图分类号:R2-03 文献标识码:结直肠癌是常见的消化道恶性肿瘤之一,严重危害人类健康。流行病学数据显示,全球结直肠癌年发病率和死亡率分别位居所有癌种的第四位和第二位,疾病负担日趋沉重1。由于左右半结肠癌具有不同的生物学特性,两者在临床表现、分子生物学特征等多方面具有较大差异,因此学界有观点认
5、为左、右半结肠癌应被视作两种不同类型的实质疾病2。临床上,左半结肠癌的病理类型以高度及中度分化的腺癌为主,预后相对较好;右半结肠癌病理类型多见低分化的腺癌、粘液腺癌和印戒细胞癌,预后较差。基于AIO KRK-0103、NCIC CO.174及FIRE-35等临床研究结果,自2017年起,美国国家综合癌症网络(National Comprehensive Cancer Network,NCCN)指南将抗EGFR治疗(西妥昔单抗和帕尼单抗)仅推荐用于 KRAS/NRAS野生型的左半结肠癌,标志着左右半肠癌临床用药决策上进入了新阶段。然而,中医学对左右半结 收稿日期:2021-08-04 修回日期:
6、2022-02-08 广州中医药大学“双一流”与高水平大学学科协同创新团队项目(2021xk23):岭南中医肿瘤学术流派的协同创新研究,负责人:周岱翰。通讯作者:刘展华,博士生导师,主任医师,主要研究方向:中西医结合防治肿瘤疾病研究。4550 Modernization of Traditional Chinese Medicine and Materia Medica-World Science and Technology 世界科学技术-中医药现代化专题讨论一:基于数据分析的结直肠癌“防治保康”模式探索肠癌辨证施治的组方用药规律尚鲜有报道,有待进一步研究。近年来研究表明,左右半结肠癌的中医
7、证型特点和症候要素具有一定的差异。王威6对151例结肠癌患者的中医证型特点分析表明,左半结肠癌以痰湿内停证为主,晚期右半结肠癌以脾肾阳虚证为主。吴桂彬7研究指出,左半结肠癌多见气滞血瘀证及湿热蕴结证,而右半结肠癌多见脾肾阳虚证及气血两虚证。辨证论治是中医的精髓,“方从法出,法随证立”,不同的证型和症候特点决定了左右半结肠癌在方药使用上必然存在一定的差异。因此,左右半结肠癌的中医组方用药的差异及内涵值得进一步探究。同时,由于中药治疗疾病具有“多成分-多靶点”的作用特点,中医药治疗结肠癌的作用机制也仍有待进一步的研究。值得庆幸的是,真实世界中临床的诊疗数据积累及数据挖掘技术在中医药领域的应用8及网
8、络药理学技术的兴起9,为透过大数据探寻中医药防治左、右半结肠癌的方药规律及相关作用机制奠定了基础。本研究旨在基于“左右半结肠癌是两种不同实质性疾病”的学术观点,应用广州中医药大学第一附属医院住院系统数据,挖掘分析左右半结肠癌组方用药规律,同时借助生物信息学及网络药理学技术对典型的方药进行作用机制的探索,为中医药对结肠癌实施精准治疗及防治结肠癌的基础研究提供理论依据。1 资料与方法 1.1资料来源2017.1.1-2020.6.30于广州中医药大学第一附属医院肿瘤中心、胃肠外科及肛肠外科住院部被确诊为结肠恶性肿瘤患者的中医临床诊疗信息。纳入本研究的中药处方数据均由肿瘤专科主任中医师开具。数据收集
9、经广州中医药大学第一附属医院伦理委员会批准,伦理文件编号:NO.JY【2020】129。1.2标准1.2.1纳入标准确诊为结肠恶性肿瘤患者;右侧结肠标准:右侧结肠包括盲肠、升结肠、结肠肝区、横结肠;左侧结肠包括结肠脾区、降结肠、乙状结肠;患者病历资料完善者:具备患者的基本信息、中医诊断、西医诊断、中医方药信息、肿瘤分期(TMN及临床分期)、肿瘤发生部位、肿瘤病理及转移部位。1.2.2排除标准符合以下条件之一者则排除研究对象:不符合原发性结肠癌诊断标准的患者;所需观察的临床病历信息记载不完整;合并有严重心脑血管、肝、肾疾病及内分泌系统疾病的患者;确诊但是为结肠外双原发(及以上)肿瘤患者;确诊但于
10、外院接受过放化疗、靶向及免疫治疗的患者。1.3统计方法与数据分析1.3.1临床数据数据库构建筛选后共录入383首处方,由两名研究者对住院病历系统进行录入,并参照 中华人民共和国药典(2015 版)进行药物规范化处理(如熟党参统计为党参;人参片统一为人参)。另一研究者对数据进行核查校对。1.3.2中药频次计算将方药数据库中所有药物进行汇总,计算各药物出现的频次,筛选出频次前15的药物进行展示。应用R软件4.0 base包的table函数进行频次计算。1.3.3方药聚类分析通过对左、右半结肠癌方药数据进行整理清洗,分别筛选使用频次大于整体中药平均频次的药物,使用R软件包apcluster10评估最
11、佳聚类数,使用R软件包cluster11进行K-means聚类分析,迭代10 000次以确定最佳聚类种子数。最后使用R软件包factoextra*进行聚类结果可视化。1.3.4药物关联性分析应用R语言arules包12进行关联规则分析。基于arules包interestMeasure函数对关联规则结果行卡方检验,同时结合Apriori关联规则算法中如下指标对中药组合关联度进行综合评价,并使用Cytoscape 3.7.213进行关联规则网络可视化。支持度(support):Support(X,Y)=P(XY)=number(XY)num(AllSamples)支持度即支持的程度,在本研究中,指
12、在所有的*Kassambara A,Mundt F(2020)._factoextra:Extract and Visualize the Results of Multivariate Data Analyses_.R package version 1.0.7(未出版)4551 Modernization of Traditional Chinese Medicine and Materia Medica-World Science and Technology 2022 第二十四卷 第十一期 Vol.24 No.11 药物中同时出现中药 X 和中药 Y 的概率,即 P(XY)。支持度揭示
13、了药物X和药物Y同时出现的频率,如果X和Y一起出现的频率非常小,则表明了X和Y之间的关联并不大;反之则说明X和Y总是相关联性强。置信度(confidence):Confidence(X Y)=P(Y|X)=P(XY)/P(X)置信度也称为可靠度,在本研究中,置信度表示药物之间关联的可信度,指在所有中药中在中药X出现的情况下中药Y出现的概率,即P(Y|X)。提升度(lift):Lift(X Y)=P(Y|X)/P(Y)在本研究中,提升度表示关联规则在出现中药X的条件下,同时出现中药Y的概率,提升度体现的是中药X和Y之间的关联关系强度,提升度大于1则表明XY是有效的强关联规则,提升度小于等于1则表
14、明XY是无效的强关联规则。本研究筛选同时满足以下标准的方药关联规则作为左右半结肠癌方药矩阵的核心关联规则:关联规则经卡方检验,所得P 矩阵平均支持度;关联规则置信度 矩阵平均置信度;关联规则提升度 1。1.4网络药理学分析1.4.1研究对象通过药物关联规则算法分析得到治疗左、右半结肠癌的关联参数均值最优的代表性方药,将左右半结肠癌代表性方药进行比对,选取各自的代表性“角药”组合作为研究对象。左半结肠癌方药研究对象为“半枝莲-法半夏-陈皮”,右半结肠癌方药研究对象为“地榆-生甘草-槐花”。1.4.2左、右半结肠癌疾病相关基因靶点获取在GeneCards数据库*14中以“Colon Cancer”
15、为检索关键词,获取结肠癌疾病相关靶点。使用R软件包TCGAbiolinks15下 载 癌 症 基 因 组 图 谱(The Cancer Genome Atlas,TCGA)数据库*中的结肠癌的转录组数据及临床信息数据,以结肠癌原发部分的左右作为主要分层因素。使用R软件包DESeq216对左、右半结肠癌转录组数据同癌旁正常组织转录组数据行差异表达分析,以分别筛选左、右半结肠癌的差异基因。筛选阈值设定为P-adjust0.05&|log2FC|1。1.4.3典型方药药物成分及基因靶点信息获取从 Batman-TCM17数据库*中收集左、右半结肠癌典型方药成分的化合物和靶基因。以数据库官方提供的默认
16、阈值作为筛选标准,筛选药物成分及其靶点数据。1.4.4药物-成分-疾病核心基因靶点网络构建将左、右半结肠癌典型方药的药物靶点分别同左、右半结肠癌疾病靶点基因进行匹配映射,使用Cytoscape 3.7.213构建药物-成分-疾病核心基因靶点网络。使用Degree(连接度)筛选典型方药治疗结肠癌的关键成分和靶点。1.4.5典型方药治疗结肠癌基因靶点蛋白互作网络构建将典型方药的治疗左、右半结肠癌的靶点基因分别输入STRING 11.0数据库中*构建蛋白-蛋白相互作用(Protein-protein interactions,PPI)网络。1.4.6典型方药治疗结肠癌核心基因靶点的生物信息学注释使用R软件包ClusterProfiler18对典型方药治疗结肠癌靶点基因进行基因本体分析(Gene Ontology,GO)及KEGG通路分析。将设置注释物种设置为“hsa”(人类),将P值阈值设置为0.01,仅纳入P.adjust值0.01的结果,并对结果按富集基因总数从大到小进行排序,并对排序前 5的GO条目及排序前 10的KEGG通路进行可视化。2 结果 2.1左、右半结肠癌中药药味分析2.1