收藏 分享(赏)

基于机器学习算法的冠心病风险预测及其特征分析模型_洪韵.pdf

上传人:哎呦****中 文档编号:2253056 上传时间:2023-05-04 格式:PDF 页数:5 大小:1.16MB
下载 相关 举报
基于机器学习算法的冠心病风险预测及其特征分析模型_洪韵.pdf_第1页
第1页 / 共5页
基于机器学习算法的冠心病风险预测及其特征分析模型_洪韵.pdf_第2页
第2页 / 共5页
基于机器学习算法的冠心病风险预测及其特征分析模型_洪韵.pdf_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 41 卷第 1 期2023 年 2 月广东医科大学学报JOURNAL OF GUANGDONG MEDICAL UNIVERSITYVol.41 No.1Feb.202353国老年学杂志,2020,40(2):267-270.9 钱章林,郑勇,吴永刚等.影响高血压脑出血微创治疗短期预后的相关因素分析J.中华临床医师杂志(电子版),2016,10(7):919-925.10 金子凡,冯娟.中性粒细胞与淋巴细胞比值对原发性急性脑出血患者短期预后的预测作用J.中国脑血管病杂志,2018,15(5):236-240,253.11 王如海,谢时帅,于强.mGS 评分对高血压脑出血破入脑室患者术后不良

2、结局预测价值J.中国神经精神疾病杂志,2020,46(7):390-394.12 钱露露,乔力,曹洋阳,等.重症高血压脑出血患者临床特征与预后相关性研究J.实用临床医药杂志,2021,25(2):28-31.13 DE OLIVERIA MANOEL A L.Surgery for spontaneous intracerebral hemorrhageJ.Crit Care,2020,24(1):45-64.14 中华医学会神经外科学分会.高血压性脑出血中国多学科诊治指南J.中华神经外科杂志,2020,36(8):757-770.15 赵继宗,周定标,周良辅,等.2464 例高血压脑出血外科

3、治疗多中心单盲研究J.中华医学杂志,2005(32):2238-2242.16 SANDSET E C,WANG X,CARCEL C,et al Sex differences in treatment,radiological features and outcome after intracerebral haemorrhage:Pooled analysis of Intensive Blood Pressure Reduction in Acute Cerebral Haemorrhage trials 1 and 2J.Eur Stroke J,2020,5(4):345-350.

4、17 XING Y,AN Z,ZHANG X,et al.Sex differences in the clinical features,risk factors,and outcomes of intracerebral hemorrhage:a large hospital-based stroke registry in ChinaJ.Sci Rep,2017,7(1):286-295.18 张通,赵军.中国脑卒中早期康复治疗指南J.中华神经科杂志,2017,50(6):405-412.19 YOU S,HAN Q,XU J,Zhong C,et al.Serum calcium an

5、d phosphate levels and short-and long-term outcomes in acute intracerebral hemorrhage patientsJ.J Stroke Cerebrovasc Dis,2016,25(4):914-920.20 WANG F,XU F,QUAN Y,et al.Early increase of neutrophil-to-lymphocyte ratio predicts 30-day mortality in patients with spontaneous intracerebral hemorrhageJ.CN

6、S Neurosci Ther,2019,25(1):30-35.21 ZHANG J,REN Q,SONG Y,et al.Prognostic role of neutrophil-lymphocyte ratio in patients with acute ischemic strokeJ.Medicine,2017,96(45):8624-8629.22 LOPPONEN P,QIAN C,TETRI S,et al.Predictive value of C-reactive protein for the outcome after primary intracerebral h

7、emorrhage:Clinical articleJ.J Neurosurg,2014,121(6):1374-1379.23 DI NAPOLI M,GODOY D A,CAMPI V,et al.C-reactive protein level measurement improves mortality prediction when added to the spontaneous intracerebral hemorrhage scoreJ.Stroke,2011,42(5):1230-1236.24 上官艺,王孟,王春娟.基于机器学习的缺血性卒中功能预后预测模型研究J.中国卒中

8、杂志,2021,16(9):895-900.25 高小莲,肖明中,陶军秀.非酒精性脂肪性肝病预测模型的特征分析J.中国全科医学,2021,24(30):3888-3892,3899.26 王任直,冯铭,刘小海.利用人工智能技术促进神经外科学科发展J.中国微侵袭神经外科杂志,2018,23(6):241-243.基于机器学习算法的冠心病风险预测及其特征分析模型 洪韵1,马勇1,陈榕1,于海兵1,丁元林1*,曹汝岱1,彭根祺1,叶向阳2*(1.广东医科大学公共卫生学院,广东东莞 523000;2.广东省东莞市人大常委会,广东东莞 523000)摘 要:目的 基于机器学习算法构建冠心病风险评估模型,

9、并比较极限梯度上升(eXtreme Gradient Boosting,XGBoost)模型和逻辑回归(Logistic Regression,LR)在预测冠心病患病风险中的效能,为冠心病的诊断提供计算机辅助方法。方法通过对kaggle 社区上发布的冠心病数据集进行预处理后,将特征变量纳入logistic 和XGBoost 模型中,对其查准率、召回率、ROC 曲线下面积(AUC)进行对比,以验证模型性能。结果XGBoost 模型相对于传统的logistic 回归模型预测性能更优,其中,年龄、性别、血糖水平、身体质量指数和收缩压为冠心病的主要危险因素。结论冠心病风险预测模型能为冠心病早期预防控制

10、及诊断提供参考依据。关键词:冠心病;模型预测;机器学习;逻辑回归;XGBoost中图分类号:R 575.5 文献标志码:A 文章编号:2096-3610(2023)01-0044-05收稿日期:2022-09-05作者简介:洪韵(1998-),女,在读硕士研究生,E-mail:通信作者:叶向阳(1967-),男,硕士,E-mail:丁元林(1967-),男,博士,教授,E-mail: 广东医科大学学报542023年 第41卷Risk prediction of coronary heart disease based on machine learning algorithm and the

11、characteristic analysis model thereofHONG Yun1,MA Yong1,CHEN Rong1,YU Hai-bing1,DING Yuan-lin1*,CAO Ru-dai1,PENG Gen-qi1,YE Xiang-yang2*(1.School of Public Health,Guangdong Medical University,Dongguan 523000,China;2.The Standing Committee of the People s Congress of Dongguan,Dongguan 523000,China)Ab

12、stract:ObjectiveTo construct a risk assessment model for coronary heart disease based on machine learning algorithms and compare the performance of eXtreme Gradient Boosting(XGBoost)model and Logistic Regression(LR)in predicting the risk of coronary heart disease to provide a computer-aided method f

13、or the diagnosis of coronary heart disease.MethodsAfter the data set of coronary heart disease released on the kaggle community were preprocessed,the feature variables were incorporated into the logistic and XGBoost models,and their precision,recall,and area under the ROC curve(AUC)were compared to

14、verify the model performance.ResultsCompared with the traditional logistic regression model,the XGBoost model had a better predictive performance.Age,gender,blood glucose level,body mass index and systolic blood pressure are the main risk factors for coronary heart disease.ConclusionThe risk predict

15、ion model for coronary heart disease can provide a reference for the early prevention,control and diagnosis of coronary heart disease.Key words:coronary heart disease;model prediction;machine learning;logistic regression;XGBoost冠状动脉粥样硬化性心脏病(CHD)是指由于冠状动脉粥样硬化使管腔狭窄或闭塞导致心肌缺血、缺氧或坏死而引发的心脏病,统称为冠状动脉性心脏病或者冠状

16、动脉疾病1。冠心病的发病机制复杂,且存在许多假说,它是由遗传和环境共同作用所导致的疾病;研究如何能够在早期进行无损伤、无创伤识别出冠心病高危个体对降低冠心病的发病率具有重要意义。机器学习是一门新兴的人工智能学科,已被广泛应用于帮助医生做出客观的预测和判断2。近年来,基于机器学习算法的预测模型广泛应用于冠心病的预测中,这对于提高诊断的准确率具有重要意义。1资料和方法1.1数据来源本文数据来源于kaggle 社区上发布的冠心病数据集,该数据集来源于一项对马瑟诸塞州佛雷明汉镇居民心血管疾病患病风险的调查。数据共包含 4 238 名调查对象的 16 条人口学特征、行为习惯和临床检查指标等潜在疾病危险因素。图 1 为该数据集部分数据展示,该数据集共包含 15 个自变量,以“10 年内冠心病是否发作”为因变量;数据集各变量名称及分类变量赋值情况见表 1。1.2缺失值处理首先,对分类变量进行统一赋值,用R4.1.3 中的 md.pattren 函数对各变量的缺失情况进行初步分析,用skim 函数对数据的分布情况进行统计描述;数据的分布情况见表 2。数据的缺失会增加分析过程中的难度,易造成分析结果的偏

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 专业资料 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2