1、第 33 卷第 1 期2023 年 2 月生物技术Biotechnology33(1):111Feb.,2023 收稿日期:2021-11-16 基金资助:江苏省临床医学科技专项-新型临床诊疗技术攻关项目(BL2014005);江苏省研究生科研与实践创新计划(KYCX21-1635)作者简介:陈苗(1996-),男,四川省眉山人,硕士,研究方向:肝胆胰疾病,E-mail:475790213 。通讯作者:易永祥(1966-),男,江苏省泰州人,博士,主任医师,二级教授,博导,研究方向:肝胆胰疾病,以第一作者、通信作者发表 SCI、核刊论文 40 余篇,E-mail:。RNA 结合蛋白对肝癌预后和
2、免疫浸润的评估价值陈苗,张家康,李述捷,易永祥(南京中医药大学附属南京医院,江苏 南京 210003)摘要:目的探索 RNA 结合蛋白(RBP)在肝癌预后以及免疫浸润中的评估价值。方法下载 TCGA 数据库中肝癌(LIHC)数据,筛选出差异表达的 RBP 基因。利用 LASSO 和多因素 COX 构建风险模型,Kaplan-Meier 方法比较高低风险组患者的预后。对高低风险组患者的差异基因进行功能富集分析。利用 GSVA 分析高低风险组免疫浸润,并比较两组患者药物敏感性和免疫治疗反应性。结果总共得到 330 个差异基因,LASSO-COX 回归模型最终纳入 6 个基因(UPF3B、MRPL5
3、4、ZC3H13、DHX58、PPARGC1A、EIF2AK4)。高风险组患者总体生存率劣于低风险组患者(P 0.05)。风险模型预测患者总体生存率的 AUROC 在 TCGA 和 ICGC 中分别为0.756 和0.781。免疫浸润分析提示高风险组调节 T 细胞富集量高于低风险组,而 NK 细胞则较低。两组患者对索拉非尼、多西他赛、顺铂敏感性有明显差异(P 0.05),且低风险组对免疫治疗更敏感。结论 RBP 风险模型可有效评估肝癌患者的预后、免疫浸润状态、化疗药物及免疫治疗的敏感性,可能为肝癌患者的风险分级和免疫治疗带来新的思路。关键词:肝癌;RNA 结合蛋白;列线图;TCGA;免疫浸润中
4、图分类号:R735.7 文献标识码:A DOI:10.16519/ki.1004-311x.2023.01.0017RNA binding protein signature for the evaluation of prognosis andimmune infiltration of hepatocellular carcinomaCHEN Miao,ZHANG Jia-kang,LI Shu-jie,YI Yong-xiang(The Second Hospital of Nanjing,Nanjing University of Chinese Medicine,Nanjing 21
5、0003,China)Abstract:ObjectiveTo explore the significance of RNA binding protein(RBP)in the prognosis and immune infiltration e-valuation of hepatocellular carcinoma(HCC).MethodData of HCC patients were downloaded from the TCGA database,dif-ferentially expressed RBP genes were screened out.The progno
6、stic genes were filtered by LASSO-COX regression analysis,and risk models were constructed.Kaplan-Meier method was used to compare the outcomes of patients in high-and low-risk groups.Functional enrichment analysis was performed for differential genes between high-and low-risk groups.GSVAwas used to
7、 analyze the immune infiltration of the high-and low-risk groups.In addition,drug sensitivity and immunothera-py response were also compared between groups.Result 330 RBPs were differentially expressed in liver cancer and adjacenttissues.The risk model included six genes(UPF3B,MRPL54,ZC3H13,DHX58,PP
8、ARGC1A,EIF2AK4).Survival analysisshowed that the prognosis of patients in the high-risk group was worse than that in the low-risk group(P 0.5且 FDR 0.05),其中 122 个 RBP 表达下调,而208 个 RBP 表达上调,结果以火山图展示(图 1A),总体 RBP 差异分析结果以热图展示(图 1B)。2.2 功能富集分析对过表达和降表达的差异 RBP 分别进行功能富集分析(图 2),GO 分析结果表明 BP(Biologicalprocess)
9、方面,上调 RBP(图 2A)(208 个)主要富集在非编码 RNA 的代谢、加工、剪切、分解和核糖核蛋白复合物生物合成等过程,而下调 RBP(图2B)(122个)则富集在调节翻译、细胞酰胺代谢、RNA 磷酸二酯键水解、机体病毒反应等过程。在 CC(Cellularcomponent)方面,上调 RBP 主要位于剪接体复合体、核糖核蛋白颗粒、核糖体和小核核糖核蛋白复合物,而下调 RBP 主要富集在细胞质核蛋白颗粒、P 小体以及线粒体核糖体。在 MF(Molecular function)方面,上调和下调 RBP 均富集于 RNA 的催化活性、mRNA 的 3UTR 区结合等。KEGG 通路分析
10、结果表明,上调(图 2C)和下调(图 2D)RBP 均富集在剪接体、mRNA 监视通路、RNA 转运和降解、核糖体生物合成等通路。图 1 差异基因分析热图和火山图注解:(A)差异 RBP 火山图;(B)差异基因热图,HCC 为肿瘤,Normal 为正常组织。Fig.1 Differentially expressed gene analysisNote:(A)Volcano map of the differentially expressed RBPs;(B)Heatmap of the differentially expressed RBPs.HCC indicates the tumo
11、r and Normalindicates the normal tissue.2.3 预后 RBP 筛选和风险模型构建与验证单因素 COX 分析初步筛选到 20 个预后相关的RBPs,见森林图(图 3A)。LASSO 回归进一步压缩变量,在偏差值取值最小时共得到 14 个基因(图 3B-C),多因素 COX 分析(图 3D)最后纳入 6 个基因进入模型(UPF3B、MRPL54、ZC3H13、DHX58、PPARGC1A、EIF2AK4)。风 险 值 计 算 公 式 为:(0.3750)UPF3B 表达+(-0.3908)MRPL54表达+(-0.2019)ZC3H13 表达+(-0.228
12、2)DHX58 表达+(-0.1438)PPARGC1A 表达+(-0.5214)EIF2AK4 表达,多因素 COX 分析结果如表 1 所示。表明除 UPF3B 以外,其余基因均为保护性基因。基于上述风险模型,计算患者风险值并根据风险值中位数将 TCGA 肝癌患者分为高、低风险亚组。生存分析显示,风险评分较低的亚组总体生存率高于高风险组(图 4A)。ROC 结果显示训练组 RBP 模型预测患者预后的曲线下面积为 0.756(图 4B),表311生 物 技 术2023 年明模型具有良好的区分度。图 4C 展示了模型基因在高低风险组中的表达情况,UPF3B 在高风险组中表达较高,而其他 5 个基
13、因则在低风险组表达较高(图 4D)。以 ICGC 数据库为验证队列进行同样分析,结果如图 5 所示,验证组的生存分析(图 5A)和ROC 分析(AUROC=0.781)(图 5B)的结论与 TC-GA 数据分析一致,且死亡患者大多集中于高风险组(图 5C-D),进一步证明了该 RBP 风险模型在评价肝癌患者预后方面的准确性。图 2 GO 和 KEGG 分析注解:(A)上调基因 GO 分析;(B)下调基因 GO 分析;(C)上调基因 KEGG 分析;(D)下调基因 KEGG 分析。Fig.2 GO and KEGG analysisNote:(A)GO analysis of the up-re
14、gulated RBPs;(B)GO analysis of the down-regulated RBPs;(C)KEGG analysis of the up-regulated RBPs;(D)KEGG analysis of the down-regulated RBPs.表 1 多因素 COX 分析结果Tab.1 Results of the multivariate COX regression analysis基因名称coefHR 值HR.95%低值HR.95%高值P 值UPF3B0.3750641.455084531.010531382.095205590.0437704MRP
15、L54-0.3908050.676511630.501975930.911732930.01026037ZC3H13-0.2019380.81714560.633198731.054529810.12068099DHX58-0.2282790.795901510.597317921.060505960.11904026PPARGC1A-0.1438020.866058910.743385111.00897640.06499514EIF2AK4-0.5214210.593676340.364993380.965638340.03565464411 1 期陈苗,等:RNA 结合蛋白对肝癌预后和免疫
16、浸润的评估价值图 3 预后基因筛选及模型构建注解:(A)单因素 COX 分析;(B)LASSO 回归分析;(C)10 倍交叉验证;(D)多因素 COX 分析。Fig.3 Filtration of prognostic RBPs and construction of risk modelNote:(A)Uni-Cox regression analysis;(B)LASSO regression analysis;(C)Ten-fold cross validation;(D)Multi-Cox regression analysis.图 4 TCGA 模型验证注解:(A)TCGA 高低风险组生存分析;(B)TCGA 模型 ROC 曲线;(C)TCGA 模型基因表达热图;(D)TCGA 患者风险值和生存状态分布图。Fig.4 Performance of the model in TCGANote:(A)Kaplan-Meier analysis of the high-and low-risk group in TCGA;(B)ROC analysis of the model i