基于机器学习和术前资料构建肝癌切除术中出血预测模型

资源描述

1、第卷第期年月福建医科大学学报基于机器学习和术前资料构建肝癌切除术中出血预测模型郑咏坤，吴春香，姚志雄摘要：目的探索借助机器学习算法利用术前资料构建肝癌切除术中出血预测模型的可行性和应用价值。方法回顾性分析例原发性肝癌手术患者的临床资料，按比例随机筛选出训练集例和测试集例。模型采用基于实际手术时间的随机森林（）模型建立，模型采用基于混合密度网络（）模型的预测手术时间联合模型建立。二分类结局的单因素回归分析采用回归模型。连续型结局变量筛选采用回归模型，模型预测精度采用均方根误差（）、平均绝对百分比误差（）等衡量；分类变量预测模型预测性能采用准确率、校准曲线、评分、工作曲线下面

2、积（）等衡量；模型性能稳定性采用全部样本的法验证。结果（）训练集“切除肝段数”项与验证集临床资料比较，差别有统计学意义（），其他项目差别无统计学意义。（）手术时间预测模型训练集、验证集与真实值差别的、分别为（，）和（，）。（）虽然训练集及内部验证中模型较模型有更高的预测准确率（），更低的评分（），更好的预测性能（：），但模型仍拥有较好的准确性及预测性能；在验证集中模型与模型有一致的准确率（）、评分（），差别无统计学意义（，）。模型与模型在训练集、验证集及内部验证的预测结果有中高度的一致性（为）。结果显示模型、表现稳定。结论利用术前资料联合、算法有助

3、于构建良好性能的肝癌切除术中出血预测模型，但需要多中心大样本数据进一步验证。关键词：肝癌；肝切除术；手术时间；术中出血；预测；机器学习文献标志码：文章编号：（）收稿日期：作者单位：福建医科大学孟超肝胆医院麻醉科，福州；中国人民解放军联勤保障部队第医院感染科，福州作者简介：郑咏坤，男，住院医师，医学硕士通信作者：姚志雄：中国肝癌发病率高。据国家癌症中心统计，中国人群肝癌粗发病率年为万，预测未来中国人群肝癌每年发病人数和死亡人数将超过万。手术切除仍是治疗原发性肝癌的主要手段。年，等报道，仍有约的肝切除术中出血。肝切除术前、后需要输注红细胞的患者占比。肝切除术中大出血和输血可

4、能增加术后并发症的发生，且可能增加癌症复发的风险，进而降低总体生存率。术中大出血风险因素包括手术时间、肿瘤特征（类型、大小、位置、是否存在血管受累）、肝切除范围、伴随的肝外器官切除等。世纪人工智能飞速发展，在肝癌的治疗决策、术前评估、精准手术切除、术后管理、指导辅助治疗等方面应用越来越广泛。随机森林算法（，）与线性建模方法相比，预测性能相当或更佳，已广泛应用于基因筛选、疾病诊断、预后疗效等医学相关领域，。如果能利用患者术前资料及算法在肝癌术前进行术中出血预测，可能有助于更好地进行围术期血资源调配、手术风险把控及术后并发症管理。肝癌切除手术时间作为重要的模型预测因子

5、之一，同样能利用混合密度网络模型（，），根据术前资料进行相当精确的预测。联合、算法构建模型，使得基于术前资料预测术中出血成为可能，有望以更准确、全面、具体的方式对肝癌手术进行风险评估。本研究回顾性分析福建医科大学孟超肝胆医院（笔者医院）年月年月例原发性肝癌手术患者的临床资料，探讨基于、算法，利用患者术前资料构建肝癌切除出血预测模型的可行性及其应用价值。对象与方法对象例中，男性例，女性例；年龄（岁）（）岁。纳入标准：（）年龄周岁；（）病理确诊为原发性肝癌，行肝癌切除术的患者；（）术中可联合“黏连松解术”或者“胆囊切除术”。排除标准：（）年龄周岁、孕妇、免疫缺陷病毒携带者、肺结

6、核活动期患者；（）有类风湿关节炎、系统性红斑狼疮等全身免疫性疾病史的患者；（）甲状腺功能亢进、甲状腺功能减退未得到纠正的患者；（）严重系统性疾病如慢性心力衰竭、慢性阻塞性肺疾病、严重肺动脉高压、肾衰竭等患者；（）阿第期郑咏坤，等：基于机器学习和术前资料构建肝癌切除术中出血预测模型司匹林、华法林等抗血小板、抗凝药物服用史，长期激素服用史的患者；（）转移性肝癌患者或“肝癌切除术”前进行了经肝动脉化疗栓塞术、放化疗、免疫治疗的患者；（）二次肝胆手术的患者；（）既往其他部位肿瘤放化疗、免疫治疗史患者；（）血液疾病患者；（）术前已经出现肝癌破裂出血的患者；（）联合“纳入标准（）”之外的手术内容的患者。本

7、研究通过笔者医院医学伦理委员会审批（审批号科审）；伦理同时批准全部患者免签知情同意书。分组出血量通过吸引器量筒和湿纱布称重法量化计算总出量，减去冲洗液量得出。纳入的患者分为出血组和出血组。机器学习构建预测模型例患者通过计算机产生随机数按比例随机筛选出训练集和测试集。其中训练集例，测试集例，采用单因素回归分析筛选指标，利用、库构建模型；采用库模块进行回归分析筛选指标，利用库、构建模型。使用训练集进行训练，运用折交叉验证，就最大深度、最小分裂样本数、子分类器数目等参数进行网格搜索，以预测准确率为优化目标，采用可重复采样的形式及特征分裂技术等形成多棵

8、分类树，投票获得最佳模型。对训练集连续型数据进行标准化和归一化，对无序分类数据进行独热编码（，一种虚拟变量设置方法）；使用库模块对数据进行聚类，获得所需正态模型混合元数目；根据特征变量数自动设置输入层神经元数目，激活函数为“”；设置层全连接隐含层，激活函数为“”；输出层设置个神经元，分别独立训练并输出个平均数、个标准差、个混合概率；输出层除混合概率激活函数为“”外，其余输出层不设激活函数（图）；为防止过拟合，训练过程中引入早停止（）技术，及时停止未能有效减少平均方差的后续训练过程。：多层感知器；：平均值；：标准差；：混合概率；：修正线性单元；：改良修正线性单元；：柔性最大传递函数；：混合

9、密度网络。图模型训练过程观察指标和评价标准（）临床资料。包括出血量、手术时间、性别、年龄、体质量指数（，）、腹腔手术史、术式、肝硬化、共存疾病、切除肝段数、术中阻断、甲胎蛋白（，）、血小板计数（，）、总胆红素（，）、丙氨酸氨基转移酶（，）、天门冬氨酸氨基转移酶（，）、白蛋白（，）、凝血酶原（，）延长时间、肌酐（，）、纤维蛋白原、最大肿瘤直径、增强扫描肿瘤边界及与血管关系等项目。（）模型预测精确度分析。（）联合、的预测模型与应用真实手术时间数据（本研究指从切皮开始至缝皮结束经历的时间）的预测模型的精确度及预测性能比较。模型比较参数采用均方根误差（，）、平均绝对百分比误差（，）评价预测的连

10、续型变量值与真实值差别，采用准确率、评分、校准图评价预测的分类变量值与真实值符合情况；采用值比较模型间分类变量预测结果是否一致；采用受试者工作曲线（，）及曲线下面积（，）比较不同模型间的预测性能；采用全部样本的次采样技术内部验证模型性能稳定性，包括准确率、评分、福建医科大学学报年值等指标平均值及可信区间。统计学处理采用软件进行统计分析。近似正态分布的计量资料以表示，组间比较采用检验。计数资料采用绝对数或率表示，组间比较采用检验。分类变量回归分析采用回归模型。模型间分类变量预测结果一致性比较采用一致性分析。模型间比较采用检验。为差别有统计学意义。结果临床资

11、料分析训练集和测试集患者除“切除肝段数”项目有差别外（），在出血量、手术时间、性别、年龄、腹腔手术史、术式、肝硬化、共存疾病、术中阻断情况、术前、延长时间、纤维蛋白原及最大肿瘤直径、增强扫描肿瘤边界及与血管关系等项目比较，差别均无统计学意义（，表）。表训练集和测试集临床基本资料分析因素训练集测试集统计值分组性别男女年龄岁腹腔手术史无有手术肝硬化是否术式腔镜中转开腹开腹最大肿瘤共存疾病无心血管病糖尿病两者均有表（续）因素训练集测试集统计值术中阻断无有肿瘤边缘清晰、与血管关系不密切是否切除肝段数个（）（）（）延长纤维蛋白原（）（）（）

12、（）：体质量指数；：甲胎蛋白；：血小板；：白蛋白；：总胆红素；：凝血酶原；：肌酐；：丙氨酸氨基转移酶；：天门冬氨酸氨基转移酶。表中年龄、手术时间、最大肿瘤直径、延长时间、纤维蛋白原、数据为，余为。机器学习模型的变量筛选及模型构建利用真实手术时间数据构建肝癌出血预测模型训练集出血者例，者例。单因素回归分析结果显示，不考虑交互作用前提下，手术时间、性别、术式、切除肝段数、术中阻断情况、最大肿瘤直径、纤维蛋白原、肿瘤边界及与血管关系、是影响出血量的相关因素（表）。将以上个变量数据纳入模型进行训练得到模型。手术时间预测模型构建及精确度分析训练集连续型数据进行标准化及归一化、无序多分类第期郑

13、咏坤，等：基于机器学习和术前资料构建肝癌切除术中出血预测模型数据进行多个二分类设置后进行折交叉验证回归，得出平均方差最小、纳入变量数目最佳对应的正则化系数值为（图），筛选出的变量为性别、腹腔术史、肝硬化诊断、术中阻断情况、延长时间、术式、共存疾病、切除肝段数、最大肿瘤直径、纤维蛋白原、增强扫描肿瘤边界及与血管关系（其中、为分类变量，赋值同表）。将以上个变量纳入模型进行训练，最终模型在训练集中预测值与真实值差别的为，为；验证集预测值与真实值差别的为，为。采用模型预测的平均手术时间值作为模型的“手术时间”变量值参与预测记为模型。表训练集出血单因素回归分析临床因素

14、赋值出血手术时间性别男女年龄体质量指数腹腔术史是否术式腔镜中转开腹开腹肝硬化是否共存疾病无心血管病糖尿病两者均有术中阻断否是（）（）（）福建医科大学学报年表（续表）临床因素赋值出血（）（）延长纤维蛋白原最大肿瘤直径肿瘤边界及与血管关系边界不清晰或关系密切边界清晰且关系不密切切除肝段数目：体质量指数；：甲胎蛋白；：血小板；：白蛋白；：总胆红素；：凝血酶原；：肌酐；：丙氨酸氨基转移酶；：天门冬氨酸氨基转移酶。为连续变量，出血量患者的手术时间、年龄、纤维蛋白原、最大肿瘤直径分别为（）、（）岁、（）、（）、（）和（）。图回归确定最佳

15、正则化系数模型与模型预测精度及预测性能比较、性能稳定性验证训练集中，模型的预测准确率为，而模型的准确率为；校准图显示模型、均较稳健（图），评分（）优于（）（表）；模型的预测性能（）优于模型（）（图），且差别有统计学意义（检验，表）。验证集中，模型与模型均有的预测准确率，两模型的稳健性及评分方面相当（）（图），预测性能（：，图）差别无统计学意义（检验，表）。无论在训练集还是在验证集，两模型有中度甚至高度以上预测一致性（表）。采用次法内部验证模型及模型的性能稳定性（表）。结果显示，模型无论在（）、评分（）还是准确率（）均优于模型，两模型仍有中高度以上预测一致性（）。

16、模型（，），（，），准确率（，）及模型（，），（，），准确率（，）各指标在内部验证中表现较稳定（表）。第期郑咏坤，等：基于机器学习和术前资料构建肝癌切除术中出血预测模型表模型间预测精度及一致性比较模型训练集准确率评分值验证集准确率评分值模型模型讨论原发性肝癌包括肝细胞癌、肝内胆管细胞癌及混合癌。肝细胞癌是亚洲和非洲的主要原发性肝癌种类，男性高发，近年来其发病率与死亡率均升高；研究报道，近年来肝内胆管细胞癌的发病率、致死率也有所上升。手术切除是治疗原发性肝癌的重要手段，也是治愈肝癌的重要途径。随着快速康复表模型间预测性能比较模型训练集验证集模型模型：曲线下面积。图模型在训练集（左）和验证集（右）的校准图（）（）（）：受试者工作曲线；：曲线下面积。图模型在训练集（左）和验证集（右）的曲线（）（）（）福建医科大学学报年表模型性能验证指标模型平均值模型平均值评分准确率值：曲线下面积。外科的推广普及，腹腔镜手术成为肝癌首次切除术的主流手术方式。荟萃分析证实，在复发性肝癌的二次肝癌切除术中，腹腔镜在减少术中出血、术后并发症、缩短

展开阅读全文

基于机器学习和术前资料构建肝癌切除术中出血预测模型_郑咏坤.pdf