1、第 51 卷收稿日期:2022年11月3日,修回日期:2022年12月10日作者简介:杨天濠,男,硕士研究生,研究方向:生物信息学。王新赠,男,博士,副教授,研究方向:生物信息学。1引言肿瘤转移是指恶性肿瘤细胞从原发部位,经淋巴道、血管或体腔等途径,到达其他部位继续生长的过程1。恶性肿瘤的转移通常发生在癌症晚期,是导致癌症患者死亡的主要原因之一。其中,肺癌的转移是一个较为复杂、由多基因参与的过程,它严重影响肺癌患者治疗的疗效和预后。骨是肺癌远处转移常见的靶部位之一,临床发现,约40%的晚期肺癌患者会发生骨转移,同时会引发多种并发症23。生物学研究证明,特定的遗传背景对癌症转移有重要的影响,有些
2、基因可能参与骨转移发展的进程。因此,对肺癌骨转移相关候选基因的鉴定和筛选对于肺癌患者的诊断和治疗具有迫切而重总第 403 期2023 年第 5 期计算机与数字工程Computer&Digital EngineeringVol.51 No.5基于蛋白质相互作用网络的肺癌骨转移基因识别方法杨天濠1王新赠2(1.中国石油大学(华东)计算机科学与技术学院青岛266580)(2.山东科技大学数学与系统科学学院青岛266580)摘要肿瘤转移通常发生在癌症晚期,是一个复杂且致命的过程,发现与肿瘤转移相关的基因对肿瘤的治疗和预后有着至关重要的作用。通过计算方法发现肿瘤转移基因,相对于昂贵且耗时的生物学方更加高
3、效。基于蛋白质-蛋白质相互作用网络(PPIN),论文提出了一种结合随机游动重启(RWR)算法的模型来识别肺癌骨转移相关基因。此外,通过置换检验规则、交互得分规则和富集分析三种方法对基因进一步筛选,最终获得了12个与肺癌骨转移有关的关键基因。文献挖掘的结果证明大部分基因直接或间接参与了肺癌骨转移过程,验证了该计算方法的有效性。这一项工作有望为肿瘤转移的临床试验提供靶标基因。关键词肿瘤细胞转移;肺癌骨转移;蛋白质相互作用网络;随机游走重启算法中图分类号R319DOI:10.3969/j.issn.1672-9722.2023.05.024Method for Identifying Genes I
4、nvolved in Lung Cancer BoneMetastasis Based on Protein-Protein Interaction NetworkYANG Tianhao1WANG Xinzeng2(1.College of Computer Science and Technology,China University of Petroleum,Qingdao266580)(2.College of Mathematics and Systems Science,Shandong University of Science and Technology,Qingdao266
5、580)AbstractTumor metastasis usually occurs in the late stage of cancer,which is a complicated and lethal process.The identification of the genes associated with tumor metastasis plays a crucial role in the therapy and prognosis of cancer.Compared with theexpensive and time-consuming biological meth
6、ods,it is more effective to find tumor metastasis-related genes through computationalmethods.Based on the protein-protein interaction network(PPIN),an integrated model using random walk with restart(RWR)algorithm is proposed to identify genes involved in lung cancer bone metastasis.In addition,those
7、 genes are further screened by threemethods,which are permutation test,interaction test and enrichment test.Finally,12 potential key genes for lung cancer bone metastasis are obtained.The results of literature review indicate that most of the inferred genes are directly or indirectly contribute toth
8、e process of lung cancer bone metastasis,thereby suggesting the effectiveness of our method.This work is expected to provide target genes for clinical trials of tumor metastasis.Key Wordstumor metastasis,lung cancer bone metastasis,protein-protein interaction,random walk with restart algorithmClass
9、NumberR31911082023 年第 5 期计算机与数字工程要的意义。目前,肿瘤转移相关基因的鉴定和验证主要依赖于临床医学及生物学实验,需要花费大量的时间和成本,限制了发现的能力。随着生物信息学的发展,一些计算方法被应用于识别疾病相关基因及其驱动因子46。相对于临床医学和生物学实验,计算方法具有高效、低成本的优点。针对恶性肿瘤转移关键基因的发现问题,我们提出了一种基于蛋白质-蛋白质相互作用网络(PPIN)的癌症转移基因识别方法,将其应用于肺癌骨转移关键候选基因的鉴定。首先利用随机游动重启(RWR)算法对基因进行分析和预选,然后通过置换检验规则消除网络结构的影响,并利用交互得分规则和富集分
10、析对基因进一步筛选,最终获得了12个可能与肺癌骨转移有关的关键基因。根据文献挖掘的结果,这些基因中有9个基因已被证实与肺癌骨转移的形成或发展有关,并揭示了这些基因可能参与的潜在分子过程,为利用计算方法研究肿瘤转移机制提供了新的思路。2数据2.1数据集肺癌和骨癌相关基因主要来源于Oncomine数据库和TCGA数据库。Oncomine数据库是一个整合了264个独立的数据集,涉及35种癌症类型的综合型癌症数据库。TCGA数据库是目前为止可以获得的公开数据库里面数据相对全面的一个,在各个领域得到了广泛的应用。通过对两个数据库的检索,我们最终得到了412个肺癌相关基因,其集合用S1表示;以及348个骨
11、癌相关基因,其集合用S2表示。2.2蛋白质相互作用网络通过对STRING数据库(版本11.0)的检索,我们得到了5,879,727个涵盖19,354种蛋白质的人类PPI(蛋白质相互作用)。研究证明这些PPI反映了蛋白质之间的直接(物理)和间接(功能)关联。其中每个PPI包含两个Ensembl ID,分别代表蛋白质pa和pb,以及一个范围在 150 和 999 的得分S()papb,代表它们的相互作用强度。基于这些数据,我们构造了一个无向加权的PPIN,包含19,354个节点和5,879,727条边。3癌症转移基因识别方法在本研究中,我们提出了一种基于PPIN的癌症转移基因识别方法,以鉴定肺癌骨
12、转移特异性关键基因。首先,结合收集的肺癌和骨癌基因数据,在 PPIN 上执行 RWR 算法,对基因进行预选。然后,通过置换检验消除网络结构的影响,得到候选基因集。最后,利用交互得分规则和富集分析对基因筛选,增强结果的准确性,得到肺癌骨转移关键基因集。整个方法的过程如图1所示。肺癌基因转移关键基因骨癌基因RWR算法RWR基因置换检验蛋白质相互作用网络交互得分规则候选基因富集分析图1方法流程图3.1随机游走重启算法RWR算法是一种经典的排序算法,它从一些种子节点开始,模拟其在网络中随机游走和重启,同时更新所有节点的概率得分并对节点进行排名7。它已被用于解决疾病基因的发现和药物重定位等问题56。RW
13、R算法的主要过程如下:输入:PPIN的列归一化的邻接矩阵A,初始概率得分向量P0=Ps1Ps2Psn(n=19354)初始化:将S1与S2中基因整合并删去重复的基因,得到682个节点作为种子节点,它们在P0中的概率得分设为1/682,其他节点的初始得分设为0;令重启概率r=0.8过程:For i=0 do执行迭代Pi+1=()1r APi+rP0(1)直到Pi+1PiL1Ps()g#total permutations(2)如果随机概率得分Psi()g普遍大于真实概率得分Ps()g,说明g更可能是因为网络结构而被选出来的假阳性基因。显然,p-value值很高的RWR基因并不是与肺癌骨转移特异性
14、相关的基因,应当被删除。由于0.05是作为被广泛接受的统计学检验传统显著性水平的阈值,我们选择p-value值小于0.05的RWR基因作为肺癌骨转移的潜在候选基因做进一步分析。3.3交互得分规则根据研究证明,PPI中交互得分高的两个蛋白质更有可能具有相似功能8。我们可以利用这一信息筛选出同时与肺癌和骨癌基因在功能上相似的候选基因。对于每个候选基因g,计算它的最大-最小交互得分MMIS:MMIS()g=minmaxS()gg:gS1maxS()gg:gS2(3)其中,S1与S2分别表示2.1节中的肺癌相关基因集合与骨癌相关基因集合,因此MMIS较高的候选基因至少同时与一个已验证的肺癌相关基因和骨
15、癌相关基因密切相关。在STRING数据库中,900是蛋白质之间的最高置信度值,因此选择MMIS得分不小于900的候选基因做进一步研究。3.4富集分析基因本体论(GO)可以从分子功能、生物学过程和细胞成分三个方面描述给定的基因及其产物;京都基因与基因组百科全书(KEGG)数据库提供了多个基因之间的生物学代谢途径。与已知肺癌和骨癌基因共享相同或相似的 GO terms和 KEGG通路的候选基因更有可能是与转移相关的基因9。首先,根据富集分析的结果计算每个候选基因g与所有 GO terms 和 KEGG 通路的关系值,得到向量ES()g。对 于 两 个 基 因g与g在 GO terms 和KEGG通
16、路上的富集分析相似性得分可以通过余弦定理计算:()gg=ES()g ES()gES()gES()g(4)具有更高()gg值的两个基因通常在分子功能和生物学过程等方面有很强的相关性。对于每个候选基因g,再计算最大-最小富集得分MMES:MMES()g=minmax()gg:gS1max()gg:gS2(5)在本研究中,我们尝试将0.9作为MMES的阈值,即筛选出MMES大于0.9的候选基因作为最终的转移关键基因。在整个方法中,对于由RWR算法和置换检验规则产生肺癌骨转移候选基因,通过交互得分规则和富集分析进行评估,选择MMIS不小于900并且MMES大于0.9的基因作为肺癌骨转移关键基因,这些基
17、因被认为在肺癌骨转移中发挥了重要作用。4结果与分析4.1结果如 3.1 节所述,我们将与肺癌和骨癌相关的682个基因作为种子节点,在PPIN上执行RWR算法,筛选概率得分大于105的基因后,得到了6850个RWR基因。其次,我们采取了置换检验规则来消除网络结构对结果的影响,得到了964个p-value值小于0.05的候选基因做进一步研究。为了更准确地识别肺癌骨转移相关基因,我们通过交互得分规则和富集分析测试对候选基因进行了评估与筛选。通过计算,对于每个侯选基因得到了一个 MMIS 和 MMES,我们选择 MMIS 不小于900并且MMES大于0.9的12个基因作为肺癌骨转移关键基因,如表1所示
18、。文献挖掘的结果证明这些关键基因基因大部分参与了肺癌骨转移的发展过程,与肺癌骨转移特异性显著相关。杨天濠等:基于蛋白质相互作用网络的肺癌骨转移基因识别方法11102023 年第 5 期计算机与数字工程表112个肺癌骨转移关键基因及其概率得分、P-value、MMIS及MMES值Ensembl IDENSP00000258149ENSP00000317272ENSP00000263388ENSP00000379204ENSP00000398632ENSP00000290921ENSP00000278568ENSP00000251849ENSP00000257430ENSP00000348838E
19、NSP00000385675ENSP00000216968Gene symbolMDM2METNOTCH3BMP7CD44CTBP1PAK1RAF1APCUBE2CIL6PROCRProbability2.49E-042.11E-042.05E-042.01E-041.79E-041.45E-041.29E-041.03E-041.02E-049.28E-057.85E-055.98E-05P-value0.0010.0020.0050.0130.0010.0110.0010.0050.0010.0010.0010.005MMIS99497699799999698898297498397799
20、4973MMES0.9820.9750.9720.9510.9630.9420.9790.9820.9390.9670.9210.9534.2分析在获得的12个肺癌骨转移关键基因中,有9个基因已被证实与肺癌骨转移的形成或发展有关,其中包括骨髓毛细血管的侵袭和外渗,对趋化因子的反应以及对骨细胞外基质的粘附等。根据以往的研究,肺癌细胞的上皮细胞-间质细胞转化(EMT)过程和骨微环境的改变被认为是肺癌形成骨转移的关键因素1011。大多数潜在的关键基因都直接或间接地参与了这两个过程,体现了它们在肺癌骨转移中的特殊作用。APC骨微环境MMPs其他EMT原癌基因MDM2CD44UBE2CNOTCH3PAK
21、1PROCRIL6BMP7CTBP1METRANK图212个关键基因的基因家族分布根据12个肺癌骨转移关键基因的基因家族,我们将它们分为5个簇,如图2所示,并进行了相应的分析。其中,MDM2 与许多癌症的发病机制有关,它刺激基质金属蛋白酶(MMPs)的表达,促进骨髓窦细胞外渗,有利于肺癌细胞通过新生血管进入血液循环,对肺癌骨转移有特异性作用1213。此外,CD44同样上调了MMPs的表达,对肺癌细胞在骨骼组织中的适应性和侵袭性起着重要作用14。EMT过程发生在肺癌骨转移的初始阶段,有利于降低细胞间黏附力,加速相邻细胞脱落。其中,BMP7、CTBP1基因调控并参与肺癌细胞的EMT过程1516,表
22、明了它们在肺癌骨转移过程中的影响。骨微环境是调节骨组织并维持其动态平衡的重要环境,肺癌骨微环境的改变在骨转移的进展中起着重要的作用。其中,APC、PROCR及 IL6基因参与了骨微环境的改变过程1718,为骨转移瘤提供生长所需营养物质,有利于肺癌细胞在骨组织中的生长和扩散。此外,原癌基因MET可以激活骨微环境中RANK信号通路,诱导破骨细胞的活化,最终导致溶骨性转移的发生19。RAF1 是一种参与 RAS信号通路的功能性原癌基因,被广泛报道参与癌症转移过程20。在尚未确定的3个基因中,UBE2C是与泛素相关的基因,编码细胞周期进展所需的蛋白质,在骨髓中广泛表达21。NOTCH3在调控肿瘤细胞的
23、凋亡、增殖的分化中起着重要作用,是多种肿瘤治疗的潜在靶标22。PAK1参与细胞粘附、迁移、增殖、凋亡、有丝分裂等多种细胞生物学过程,促进肺癌细胞的增殖及侵袭能力23。这些基因可能是潜在的肺癌骨转移相关基因,值得进一步研究。5结语肿瘤转移是一个复杂的过程,通常是促进肿瘤加重的主要原因。肿瘤转移相关基因的鉴定可为肿瘤转移的治疗提供分子靶点,有助于癌症患者的治疗和预后。在本研究中,基于两种相互作用更强的蛋白质更可能具有相似功能的假设,我们在PPIN上设计了一种综合方法来识别癌症转移相关的基因。我们将该方法运用于肺癌骨转移相关基因的鉴定,最终获得了12个潜在的肺癌骨转移关键基因并进行了广泛分析。结果表
24、明,大多数鉴定的基因已被证实有助于肺癌骨转移的进程,体现了1111第 51 卷该方法的有效性和合理性。我们希望这一贡献将有助于识别肿瘤转移特异性基因,并为肿瘤转移的机理研究提供启示。参 考 文 献1Valastyan S,Weinberg R.Tumor metastasis:molecularinsights and evolving paradigms J.Cell,2011,147(2):275-292.2Luo Q,Xu Z,Wang L,et al.Progress in the research onthe mechanism of bone metastasis in lung
25、cancer J.Molecular and Clinical Oncology,2016,5(2):227-235.3Katakami N,Kunikane H,Takeda K,et al.ProspectiveStudy on the Incidence of Bone Metastasis(BM)and Skeletal-Related Events(SREs)in Patients(pts)with StageIIIB and IV Lung CancerCSP-HOR 13 J.Journal ofThoracic Oncology,2014,9(2):231-238.4Lu S,
26、Yan Y,Li Z,et al.Determination of genes relatedto uveitis by utilization of the random walk with restart algorithm on a protein-protein interaction network J.International Journal of Molecular Sciences,2017,18(5):1045.5Luo H,Wang J,Li M,et al.Computational drug repositioning with random walk on a he
27、terogeneous network J.IEEE/ACM Transactions on Computational Biology andBioinformatics,2018,16(6):1890-1900.6Yuan F,Lu W C.Prediction of potential drivers connecting different dysfunctional levels in lung adenocarcinomavia a protein-protein interaction network J.Biochimicaet Biophysica Acta(BBA)-Mol
28、ecular Basis of Disease,2018,1864(6):2284-2293.7Khler S,Bauer S,Horn D,et al.Walking the interactome for prioritization of candidate disease genes J.TheAmerican Journal of Human Genetics,2008,82(4):949-958.8Ng K L,Ciou J S,Huang C H.Prediction of protein functions based on function-function correlat
29、ion relations J.Computers in Biology and Medicine,2010,40(3):300-305.9Yang J,Chen L,Kong X,et al.Analysis of tumor suppressor genes based on gene ontology and the KEGG pathway J.PloS one,2014,9(9):e107202.10Wood S L,Pernemalm M,Crosbie P A,et al.The roleof the tumor-microenvironment in lung cancer-m
30、etastasis and its relationship to potential therapeutic targetsJ.Cancer Treatment Reviews,2014,40(4):558-566.11Zheng Y,Zhou H,Dunstan C R,et al.The role of thebone microenvironment in skeletal metastasis J.Journal of Bone Oncology,2013,2(1):47-57.12Chen X,Qiu J,Yang D,et al.MDM2 promotes invasionand
31、 metastasis in invasive ductal breast carcinoma by inducing matrix metalloproteinase-9 J.PloS one,2013,8(11):e78794.13Qian G,Hao S,Yang D,et al.P15,MDM2,NF-B,and Bcl-2 expression in primary bone tumor and correlation with tumor formation and metastasis J.International Journal of Clinical and Experim
32、ental Pathology,2015,8(11):14885.14Kan C,Vargas G,Pape F L,et al.Cancer cell colonisation in the bone microenvironment J.International Journal of Molecular Sciences,2016,17(10):1674.15Buijs J T,Henriquez N V,van Overveld P G M,et al.TGF-and BMP7 interactions in tumour progressionand bone metastasis
33、J.Clinical&Experimental Metastasis,2007,24(8):609-617.16Zhang X L,Huang C X,Zhang J,et al.CtBP1 is involved in epithelial-mesenchymal transition and is a potential therapeutic target for hepatocellular carcinomaJ.Oncology Reports,2013,30(2):809-814.17Shen K,Murphy C M,Chan B,et al.Activated proteinC
34、(APC)can increase bone anabolism via a protease-activated receptor(PAR)1/2 dependent mechanismJ.Journal of Orthopaedic Research,2014,32(12):1549-1556.18Mak I W Y,Cowan R W,Turcotte R E,et al.PTHrP induces autocrine/paracrine proliferation of bone tumorcells through inhibition of apoptosisJ.PLoS One,
35、2011,6(5):e19975.19Mukai S,Yorita K,Kawagoe Y,et al.Matriptase andMET are prominently expressed at the site of bone metastasis in renal cell carcinoma:immunohistochemical analysis J.Hum Cell,2015,28(1):44-50.20Sasaki K,Hitora T,Nakamura O,et al.The role ofMAPK pathway in bone and soft tissue tumors
36、J.Anticancer Research,2011,31(2):549-553.21Kim J,Kim Y,Choi H,et al.Ubiquitin C decrementplays a pivotal role in replicative senescence of bone marrow mesenchymal stromal cellsJ.Cell death&Disease,2018,9(2):1-18.22Liu L,Chen X,Wang Y,et al.Notch3 is important forTGF-induced epithelial-mesenchymal tr
37、ansition innon-small cell lung cancer bone metastasis by regulatingZEB-1J.Cancer Gene Therapy,2014,21(9):364-372.23Wu D W,Wu T C,Chen C Y,et al.PAK1 Is a NovelTherapeutic Target in Tyrosine Kinase Inhibitor-Resistant Lung Adenocarcinoma Activated by the PI3K/AKTSignaling Regardless of EGFR MutationJ.ClinicalCancer Research,2016,22(21):5370-5382.杨天濠等:基于蛋白质相互作用网络的肺癌骨转移基因识别方法1112