1、山东医药2023 年第 63 卷第 3 期多发性骨髓瘤/浆细胞白血病差异表达基因生物学功能、关键基因表达水平及其与预后的关系常慧娟,孟夜,朱玉榕,班燕芳,章建国,王芝涛,秦慧安徽医科大学第二附属医院,合肥230601摘要:目的筛选出多发性骨髓瘤(MM)与浆细胞白血病(PCL)之间的差异表达基因,了解其生物学功能,明确关键基因表达水平与 MM 预后的关系。方法从公共基因芯片数据库(GEO)中下载 MM 与 PCL 芯片数据集GSE66291和GSE70323,在R软件中用Limma包分别筛选差异表达基因(DEGs)并取交集。利用基因本体(GO)以及京都基因与基因组百科全书(KEGG)信号通路分析
2、对DEGs进行功能和通路注释,使用Sring对交集的DEGs构建蛋白质蛋白质互作网络(PPI),筛选关键基因,使用 Cytohubba 插件筛选相关度前 20 位的关键基因,最后在GSE24080中根据关键基因的表达水平将 MM 患者分为高表达组及低表达组,比较高低表达组的总体生存率。结果共获取DEGs 389 个,120个上调,269个下调。GO分析结果显示:在细胞组分方面主要与细胞膜外区域相关;在生物过程方面,参与白细胞游走、中性粒细胞聚集、体液免疫等;分子功能方面,主要与抗原结合相关。KEGG结果提示DEGs在细胞黏附分子、局灶性黏附等相关通路上富集。筛选出CDH1、CD44等20个关键
3、基因,其中CXCL12、CDH1、RNASE3、LYZ、PPBP、VCAM1、QPCT、PECAM1与MM高表达组MM患者的总体生存率高于低表达组(P均0.05)。结论MM与PCLD的DEGs中120个上调,269个下调。DEGs主要与细胞膜外区域相关,参与白细胞游走、与抗原结合、调控细胞黏附分子及局灶性黏附等相关通路。CXCL12、CDH1、RNASE3、LYZ、PPBP、VCAM1、QPCT和PECAM1可能是与MM患者预后相关的关键基因,其高表达组MM患者预后较好。关键词:多发性骨髓瘤;浆细胞白血病;差异基因;基因本体功能分析;京都基因与基因组百科全书信号通路分析;预后doi:10.39
4、69/j.issn.1002-266X.2023.03.009 中图分类号:R551.3 文献标志码:A 文章编号:1002-266X(2023)03-0044-04Biological function of differentially expressed genes,expression of core genes in multiple myeloma/plasma cell leukemia and their relationships with the prognosisCHANG Huijuan,MENG Ye,ZHU Yurong,BAN Yanfang,ZHANG Jian
5、guo,WANG Zhitao,QIN HuiThe Second Hospital of Anhui Medical University,Hefei 230601,ChinaAbstract:Objective To screen the differentially expressed genes(DEGs)between multiple myeloma(MM)and plasma cell leukemia(PCL),to understand their biological functions,and to clarify the relationship between exp
6、ression of core genes and prognosis of MM.Methods The mi-croarry data of GSE66291 and GSE70323,which contained the information of MM and PCL patients,were downloaded from the Gene Expression Omnibus(GEO),the DEGs were screened by limma package in R software.Functional and pathway annotation of DEGs
7、were conducted by using Gene Ontology(GO)and Kyoto Encyclopedia of Genes and Genomes(KEGG)signaling pathway analysis.The protein-protein interaction(PPI)network was constructed by String database;then,Cytohubba was used to select the top 20 related core genes.According to the expression levels of co
8、re genes in GSE13591,patients with MM were divided into the high expression and low expression group.Finally,the overall survival of the different expression groups was compared in GSE24080.Results Totally 389 DEGs were obtained,including 120 up-regulated genes and 269 down-regulated genes.The GO an
9、alysis results showed that the components of the cells were mainly related to the extracellular membrane region.In terms of biological processes,leukocyte migration,neutrophil aggregation and humoral immunity were the key regions of differential gene expression.In terms of molecular function,it was
10、mainly related to antigen binding.KEGG results suggested that 基础研究 基金项目:国家自然科学基金资金项目(82200225)。通信作者:秦慧(E-mail:)开放科学(资源服务)标识码(OSID)44山东医药2023 年第 63 卷第 3 期DEGs were enriched in cell adhesion molecules,focal adhesion and other related pathways.Twenty core genes were selected,such as CDH1 and CD44.Among
11、 those core genes,the overall survival of MM patient with CXCL12,CDH1,RNASE3,LYZ,PPBP,VCAM1,QPCT,and PECAM1 was significantly higher in the high expression group than in the low expression group(all P1 且 P0.05。FC(fold change)表示 DEGs的差值倍数。使用 R 软件中的 ggplot2 和 pheatmap程序包分析DEGs的差异性表达并进行可视化,使用在线工具 Draw
12、Venn diagram(bioinformatics.psb.ugent.be/webtools/Venn/)绘制Venn图,找出在两组基因芯片数据集中同时上调或者下调的交集基因,即为MM与PCL DEGs,下简称为DEGs。1.3DEGs 生物学功能分析在 R 中使用 ClusterProfiler包,采用基因本体论(GO)分析DEGs的基因本体功能,包括生物过程、细胞组成和分子功能三个部分;采用京都基因及基因组百科全书(KEGG)进行DEGs的信号通路富集分析。以adjust P0.05作为筛选条件选出富集结果,将其可视化。1.4关键基因的筛选利用 String 在线数据库(https:
13、/string.embl.de/)对上述所得的DEGs进行分析,构建 DEGs的蛋白质间相互作用网络(PPI),使用 Cytoscape 软件(http:/cytoscape.org/)对结果进行可视化。使用 Cytohubba 插件对 PPI 上所有DEGs进行评分,本研究选取相关度前20位的DEGs作为关键基因,即hub基因。1.5关键基因的表达与 MM 患者预后的关系分析根据关键基因的mRNA表达值,将MM患者分为 高 表 达 组 及 低 表 达 组,并 在 芯 片 数 据 集GSE240809-12对高表达组及低表达组MM患者进行生存预后分析。当P0.05时,表示该基因对于MM患者总体
14、生存率具有显著影响。2 结果 2.1DEGs 及其生物学功能总共获得了 210 例MM和57例PCL患者的基因数据,筛选得到DEGs共389 个,其中 120 个(30.8%)基因表达上调,269 个(69.2%)基因表达下调。GO分析结果显示:DEGs参与表达的细胞组分主要与细胞膜外区域相关;在生物过程方面,主要参与45山东医药2023 年第 63 卷第 3 期白细胞游走、中性粒细胞聚集、体液免疫等;分子功能方面,主要与抗原结合相关。KEGG结果提示DEGs在细胞黏附分子、局灶性黏附等相关通路上富集。2.2关键基因及其与MM预后的关系根据MCC算法选出得分前 20 的基因即为关键基因,分别为
15、 LYZ,MMP8,QPCT,CRISP3,MMP9,PPBP,HBB,BPI,RNASE3,MPO,RNASE2,PLAC8,CD44,ITGA6,CDH1,CXCL12,ITGB7,ITGB3,VCAM1,PECAM1。在GSE24080数据集中分析结果表明,CXCL12、CDH1、RNASE3、LYZ、PPBP、VCAM1、QPCT、PECAM1 的高表达组(279 例)总体生存率分别为75.6%、77.8%、74.2%、75.6%、74.6%、73.8%、76.0%、78.1%,低表达组(280例)总体生存率分别为 70.0%、67.9%、71.4%、70.0%、71.1%、71.8%
16、、69.6%、67.5%,高 表 达 组 高 于 低 表 达 组(P 均 0.05)。3 讨论 MM是常见的血液系统恶性肿瘤,其髓外病变(EMD)是一种骨髓外单克隆浆细胞恶性增殖,在MM 患者诊断时的发生率为 7%17%,在疾病过程中的发生率为6%20%13。PCL是一种罕见的具有侵袭性的骨髓瘤变种,其外周血中存在20%以上的浆细胞或浆细胞绝对值大于2109/L,占MM患者的2%4%14。尽管目前不断引入新的治疗方案15-16,但EMD和PCL仍预后不良17-18。因此了解从MM到PCL发生发展的分子机制和关键基因对于MM EMD的诊断和治疗有重要意义。本研究选取GEO数据库中MM和PCL样本量较大的两组基因芯片数据,通过生物信息学技术对其分析,从而筛选出DEGs共389 个,其中120个基因表达上调,269 个基因表达下调。对于 DEGs 进行GO分析的结果提示DEGs主要参与白细胞游走、体液免疫等生物学过程。KEGG分析显示DEGs在细胞黏附分子、局灶性黏附等相关通路上集中富集。这表明筛选出的DEGs可能在干扰正常组织的免疫功能及促进肿瘤细胞侵犯正常组织方面发挥作用。对于DEGs进