基于生物信息学方法筛选重度...关键基因及潜在治疗药物预测

资源描述

1、 400 神经疾病与精神卫生2023年6月20日第23卷第6期 Journal of Neuroscience and Mental Health，June 20，2023，Vol.23，No.6抑郁症的精准治疗专题基于生物信息学方法筛选重度抑郁症关键基因及潜在治疗药物预测王相文王圣海孙辰辉曲春晖孙平272000 济宁医学院精神卫生学院（王相文）；266034 青岛市精神卫生中心科教科（王圣海），老年二科（孙辰辉、曲春晖、孙平）；200030 上海交通大学医学院附属精神卫生中心临床研究中心（孙平）通信作者：孙平，Email：DOI：10.3969/j.issn.1009-6574.20

2、23.06.004【摘要】目的通过生物信息学方法筛选重度抑郁症关键基因及潜在治疗药物。方法收集GEO公共数据库中GSE98793、GSE76826数据集作为数据来源，采用在线工具及R语言进行数据分析、差异表达基因筛选和富集分析。蛋白质-蛋白质互作网络分析采用STRING数据库进行。关键基因的筛选采用Cytoscape软件。采用受试者工作特征（ROC）曲线评价诊断价值，采用Connectivity Map数据库预测治疗重度抑郁症的小分子药物。结果筛选出TLR2、CD28、IL7R、IRF4、MAPK14共5个关键基因。ROC曲线结果显示，5个关键基因在GSE98793、GSE76826数据

3、集中的ROC曲线下面积为0.6160.804。预测得到UBP-302、ketanserin、CS-1657、androstenol、taurocholic-acid共5种小分子药物可能对改善重度抑郁症患者症状有潜在价值。结论 TLR2、CD28、IL7R、IRF4、MAPK14可能是重度抑郁症患者发病的关键基因，UBP-302、ketanserin、CS-1657、androstenol、taurocholic-acid 5个小分子化合物可能对于抑郁症状改善有一定效果，可为后续药物研究提供思路。【关键词】生物信息学；抑郁症；差异基因基金项目：山东省医药卫生科技发展计划（2017WS748）Bi

4、oinformatics-based approach for screening hub genes and predicting potential therapeutic agents for major depressive disorder Wang Xiangwen，Wang Shenghai，Sun Chenhui，Qu Chunhui，Sun Ping School of Mental Health，Jining Medical University，Jining 272000，China（Wang XW）；Department of Science and Education

5、，Qingdao Mental Health Center，Qingdao 266034，China（Wang SH）；Department II of Geriatrics，Qingdao Mental Health Center，Qingdao 266034，China（Sun CH，Qu CH，Sun P）；Clinical Research Center，Shanghai Mental Health Center，Shanghai Jiao Tong University School of Medicine，Shanghai 200030，China（Sun P）Correspond

6、ing author：Sun Ping，Email：【Abstract】Objective To screen hub genes and potential therapeutic agents for major depressive disorder（MDD）by bioinformatics methods.Methods The GSE98793 and GSE76826 datasets in the GEO database were used as the data source.Data analysis，differential expression gene（DEG）sc

7、reening and enrichment analysis were carried out using online tools and R soft.STRING database was used to analyze protein-protein interaction network，and Cytoscape was used to screen hub genes.Receiver operating characteristic（ROC）curve was used to evaluate the diagnostic value，and Connectivity Map

8、 database was used to predict small molecule drugs for severe MDD.Results A total of 5 hub genes（TLR2，CD28，IL7R，IRF4，MAPK14）were screened out.The ROC curve results showed that the area under the ROC curve of the 5 hub genes in the GSE98793 and GSE76826 datasets ranges from 0.616 to 0.804.It was pred

9、icted that UBP-302，ketanserin，CS-1657，androstenol，taurocholic acid，a total of 5 small molecule drugs，may have potential value in improving the symptoms of patients with major depressive disorder.Conclusions TLR2，CD28，IL7R，IRF4，MAPK14 may be key genes in the pathogenesis of MDD patients.The 5 small m

10、olecule compounds UBP-302，ketanserin，CS-1657，androstenol，and taurocholic-acid may have a certain effect on improving depressive symptoms and can provide ideas for subsequent drug research.【Key words】Bioinformatics methods；Depressive disorder；Differentially-expressed genesFund program：Shandong Provin

11、cial Medical and Health Science and Technology Development Plan（2017WS748）401 神经疾病与精神卫生2023年6月20日第23卷第6期 Journal of Neuroscience and Mental Health，June 20，2023，Vol.23，No.6重度抑郁症（major depressive disorder，MDD）是一种以心境低落、兴趣减退、认知功能受损和自主神经紊乱为核心症状的疾病1-2，位列致全球健康寿命损失年因素第5位3。世界精神卫生组织的调查显示，约20%的人群在一生中的某个时刻符合MDD

12、的标准4。在我国成年人群体中，MDD的患病率高达3.4%5。由于抑郁症的高患病率、高自杀风险，给个人和社会带来了极大的负担。目前，临床中常用的诊断方式主要是基于症状学评估，但其标准尚待阐明6-7，而MDD的高发病率、中等遗传率为抑郁症遗传靶点的确认提出了挑战8。生物信息学分析技术在肿瘤领域已经被广泛应用，但在精神疾病领域的研究却较少。随着基因芯片、高通量测序等生命科学技术的发展，目前公开数据库中精神疾病的数据日渐完善。因此，本研究收集了两个数据集进行合并分析，筛选出MDD相关的关键基因，并预测潜在治疗药物，为治疗MDD提供新的思路。一、材料与方法1.数据收集：从美国国家生物技术信息中心（Nat

13、ional Center for Biotechnology Information，NCBI）下属GEO（Gene Expression Omnibus）数据库9-10中筛选GSE9879311、GSE7682612作为数据来源。两组数据集均包含MDD患者与健康对照者的系列表达矩阵数据，且上传时间均为5年内，相较于其他数据集，两者具有较强的时效性。其中GSE98793基于Affymetrix U133_Plus2.0平台测序，数据集中包含64例MDD患者及64名健康对照者，GSE76826基于Agilent SurePrint G3 Human GE 860K v2平台测序，数据集中包含20

14、例MDD患者及12名健康对照者。两组样本均已经过归一化处理。2.差异表达基因（differential expression gene，DEG）的筛选及数据处理：两组数据使用GEO数据库内的在线分析工具GEO2R10，13进行DEG的筛选，该在线分析工具是基于R语言3.2.3版本及limma程序包143.26.8版本的分析软件。两组数据的分析结果使用在线工具仙桃学术（https：/www.xiantao.love）进行火山图绘制，以此实现结果可视化。两组数据的DEG使用在线工具（http：/bioinformatics.psb.ugent.be/webtools/Venn）进行Ven

15、n图绘制，交集内基因被认为是共同的DEG。使用ComplexHeat map包15对两组数据进行热图绘制。3.富集分析：利用David数据库16-17（https：/DAVID.ncifcrf.gov/）进行基因本体论（Gene Ontology，GO）18-19及京都基因与基因组百科全书（Kyoto Encyclopedia of Genes and Genomes，KEGG）富集功能分析，DAVID数据库是一个集成基因注释、可视化与集成发现的在线数据库，旨在为大量的基因、蛋白质体重功能注释及分析工具。GO是一种系统的对基因及其表达产物进行注释的方法和过程，其分析内容包括生物过程水平（bio

16、logical processes，BP）、细胞组分水平（cellular components，CC）、分子功能水平（molecular functions，MF）3个维度。KEGG是一个整合了基因组、化学和系统功能信息的综合数据库，被广泛用于基因通路的富集注释。GO、KEGG分析均以P0.05为筛选标准，P值矫正方法为Benjamini-Hochberg法。4.蛋白质-蛋白质互作（protein-protein interaction networks，PPI）网络分析：利用STRING 11.5数据库20 分析DEG之间的潜在相互关系，以中等置信度score 0.4为标准构建PPI关系，并将结果导入Cytoscape（版本号3.9.1、Java 11.0.6）进行网络图构建，使用CytoHubba插件21进行关键（Hub）基因的筛选。5.诊断价值评估：为进一步探索关键基因在MDD中的诊断价值，采用pROC包（版本号1.18.0、R 4.2.1）进行受试者工作特征（receiver operating characteristic，ROC）分析和曲线下面积（area

展开阅读全文

基于生物信息学方法筛选重度...关键基因及潜在治疗药物预测_王相文.pdf