1、论著与临床研究复发性外阴阴道假丝酵母菌病患者宫颈病变的多层人工神经网络分类预测模型的构建刘昊,莫坚基金项目:南宁市科学研究与技术开发计划项目(项目编号:)作者单位:广西 南宁,南宁市第一人民医院妇科作者简介:刘昊,毕业于广西医科大学,硕士研究生,副主任医师,主要研究方向为宫颈病变通信作者,:【摘要】目的 构建复发性外阴阴道假丝酵母菌病(,)患者宫颈病变的多层人工神经网络分类预测模型。方法 选取 年 月至 年 月在南宁市第一人民医院妇科门诊诊断为 的 例患者,行阴道分泌物检查,并依据 检查结果,以 阳性患者为观察组(例),阴性为对照组(例)。收集患者相关资料及实验室检查指标,一方面,采用单因素方
2、差分析筛选出与宫颈病变相关的变量作为自变量,纳入多因素 回归模型进行分析;另一方面,随机选取数据集的 为训练集(例),用以建立多层人工神经网络分类预测模型,为测试集(例),用于该模型测试,采用接受者工作特征()曲线评估两种模型的预测效能。结果 回归模型预测 发生宫颈病变的 曲线下面积为.,灵敏度为.,特异度为.,多层人工神经网络模型预测 发生宫颈病变的 曲线下面积为.,灵敏度为.,特异度为.。结论多层人工神经网络分类模型相较于 回归模型,预测效能更高,分类性能优良,结果证实加德纳菌及杂菌、白细胞脂酶是 患者宫颈病变的独立危险因素,乳酸杆菌和过氧化氢是其保护因素。【关键词】复发性外阴阴道假丝酵母
3、菌病;乳酸杆菌;过氧化氢【中图分类号】【文献标志码】【文章编号】():.,:【】(),()(),中国计划生育和妇产科 年 第 卷 第 期 (),()().,.;.,.,【】;复 发 性 外 阴 阴 道 假 丝 酵 母 菌 病(,)严重影响患者的生活质量、心理健康和性生活。研究表明,长时间的阴道菌群紊乱,可引起人乳头瘤病毒(,)感染和持续不消退,而进展为宫颈癌。现阶段临床将 病毒检测作为宫颈病变的常规筛查方法,但针对宫颈病变的高风险患者,临床缺乏一种简单快速、科学客观的识别方法或预测手段,而且目前影响 感染并阻止疾病进展为癌前病变的因素有哪些,国内外尚未达成共识。回归是采用线性模型,寻找疾病危险
4、因素及预测疾病风险的常用分析方法,但对于当自变量与因变量为非线性关系时,预测效果不够理想。依托大数据学习可根据多项生理指标预测 患者宫颈病变发生风险,与传统统计学方法相比,多层人工神经网络可以高效处理更多医学数据,且可使用函数近似方法拟合复杂的函数,解决非线性分类问题,是 患者感染 的一种低成本辅助性风险评估工具。由此,本研究依据多项指标构建 回归及多层人工神经网络模型,预测 患者发生宫颈病变的风险,并比较两种模型的性能,报道如下。材料与方法 研研究究对对象象选取 年 月至 年 月于南宁市第一人民医院妇科门诊就诊,明确诊断为 的 例患者,作为研究对象,行阴道分泌物检查。纳入标准:患者:既往患单
5、纯性外阴阴道假丝酵母菌病,经治疗后,临床症状和体征消失,假丝酵母菌检查阴性后,再次出现症状,经假丝酵母菌检查又为阳性,年内发作 次或以上;有性生活史女性;年龄 岁;此次就诊时无阴道炎临床症状;无宫颈手术史及 治疗史;此前疾病处于活动期未用药或缓解期避开局部用药阶段。排除标准:有自身免疫性疾病者;妊娠期或月经期;合并滴虫、衣原体、淋球菌、等其他性传播疾病者;近 个月连续服用抗生素或其他特殊药物者;内有性生活、阴道冲洗或阴道放药者。既往有反复阴道炎症,但不符合 标准者。异常,为 及以上宫颈病变患者。最终符合入组标准的患者 例,依据 检查结果,以 阳性患者为观察组,以 阴性患者为对照组,观察组患者
6、例,对照组患者 例。本研究经南宁市第一人民医院伦理委员会审核批准,所有患者对本研究知情并签署知情同意书。观观察察指指标标收集患者年龄、病程等一般资料及阴道分泌物的微生态指标,如清洁度、乳酸杆菌、加德纳菌及杂菌、乙酰氨基葡糖苷酶、唾液酸苷酶、过氧化氢、白细胞脂酶、值等实验室检查指标。回回归归模模型型建建立立采用单因素方差分析筛选出与宫颈病变相关的变量作为自变量,以是否存在宫颈病变(是 ,否 )为因变量,进行多因素 回归分析。多多层层人人工工神神经经网网络络分分类类模模型型建建立立通过 语言利用 包构建由 个输入层、多个隐含层及 个输出层组成的多层人工神经网络分类模型(图),该模型是一种深度学习模
7、型,可将输入变量映射到高维非线性空间、学习到多个输入变量之间的复杂相关性,进而提高预测准确性。输入层隐藏层输出层图 多层人工神经网络分类模型示意图 模型入选变量纳入患者年龄、病程、阴道分泌物清洁度、乳酸杆菌、加德纳菌及杂菌、乙酰氨 基葡糖苷酶、唾液酸苷酶、过氧化氢、白细胞脂酶、值 个指标作为多层人工神经网络的输入层,输入层各指标定义及赋值(表),输出变量为患者检查结果是否属于 阳性。表 各指标定义及赋值指标定义指标类型赋值年龄连续数值(岁)病程连续数值(年)清洁度分类 ,乳酸杆菌分类,加德纳菌及杂菌分类,乙酰氨基葡糖苷酶分类阴性,阳性 唾液酸苷酶分类阴性,阳性 过氧化氢分类阴性,阳性 白细胞脂
8、酶分类阴性,阳性 值连续数值(无)数据预处理 本研究基于多变量方法进行数据分析,根据研究对象是否属于 阳性进行分类。数据集包括 个输入变量和 个输出变量,其中有 个输入变量部分样本存在数据缺失,缺失率小于.,缺失值以 位填补。通过随机数字法选取数据集的 为训练集,为测试集,训练集共 例,用于模型训练,建立预测模型;测试集 例,用于模型测试,检验模型的预测效能。统统计计学学方方法法采用双录入方式录入数据,并使用 .软件建立数据库。采用 .统计学软件进行数据分析,符合正态分布的连续变量采用 表示,采用 检验;分类变量采用例数构成比表示,采用 检验;采用单因素方差分析筛选出与宫颈病变相关的变量作为自
9、变量,纳入 回归模型;对训练集和测试集中各组患者的参数进行比较,采用 语言 包构建多层人工神经网络分类模型;采用接受者工作特征(,)曲线评估预测效应,.为差异有统计学意义。结果 单单因因素素分分析析两组患者病程、乳酸杆菌、加德纳菌及杂菌、乙酰氨基葡糖苷酶、唾液酸苷酶、过氧化氢、白细胞脂酶、值等指标比较,差异均有统计学意义(.),详见表。表 单因素分析指标观察组()对照组()值 值年龄(岁)病程(年)清洁度 ()()()()乳酸杆菌 加德纳菌及杂菌 乙酰氨基葡糖苷酶(阳性)()()唾液酸苷酶(阳性)()()过氧化氢(阳性)()()白细胞脂酶(阳性)()()值 注:表示 值 多多因因素素 回回归归
10、分分析析将单因素分析筛选出的特征变量作为自变量,以是否存在宫颈病变(是 ,否 )为因变量,进行多因素 回归分析,结果显示,加德纳菌及杂菌、白细胞脂酶是 患者宫颈病变的危险因素,乳酸杆菌、过氧化氢是保护因素,详见表。表 多因素 回归分析变量 值 病程 乳酸杆菌 加德纳菌及杂菌 乙酰氨基葡糖苷酶 唾液酸苷酶 过氧化氢 白细胞脂酶 值 中国计划生育和妇产科 年 第 卷 第 期观察组对照组年龄病程清洁度乳酸杆菌加德纳菌及杂菌乙酰氨基葡糖苷酶唾液酸苷酶过氧化氢白细胞酯酶PH值图 预测 患者宫颈病变发生风险的多层人工神经网络分类结构图10000-1000I1年龄I2病程I3清洁度I4乳酸杆菌I5加德纳菌及
11、杂菌I6乙酰氨基葡糖苷酶I7唾液酶苷酶I8过氧化氢I9白细胞酯酶I10pH值I8I5I9I4I1I3I10I2I6I7重要性图 模型中各指标重要性 训训练练集集和和测测试试集集中中各各组组患患者者参参数数比比较较训练集和测试集中观察组与对照组患者病程、清洁度、乳酸杆菌、加德纳菌及杂菌、乙酰氨基葡糖苷酶、唾液酸苷酶、过氧化氢、白细胞脂酶、值等指标比较,差异有统计学意义(.)。多多层层人人工工神神经经网网络络分分类类模模型型展展示示本研究中训练样本 例,测试样本 例,对数据分类的正确率均达到.,模型的诊断参数均为.,说明所构建的多层神经网络预测模型的效果很好。模型展示图见图。可可视视化化模模型型中
12、中各各指指标标的的重重要要性性比比较较图 为多层人工神经网络分类模型中各指标的重要性排序,根据权重大小,特征重要度排名前 的输入变量分别是乳酸杆菌、过氧化氢、加德纳菌及杂菌、白细胞脂酶。模模型型的的预预测测效效能能比比较较两种模型的预测结果见下页图,回归模型 曲线下面积为.,灵敏度为.,特异度为.,在保证模型的稳定性和泛化性的前提下,最终确定多层人工神经网络分类模型 曲线下面积为.,灵敏度为.,特异度为.,多层人工神经网络分类模型的预测效能高于 回归模型。讨论女性生殖道是重要的微生态区域,是由阴道正常解剖结构、阴道微生物群、局部免疫系统和内分泌调节系统等组成的相对平衡复杂体系,是人体重要的生物
13、屏障之一。已有研究证实,感染与阴道微生态菌群构成有关,阴道菌群平衡失调可能增强 病毒的表达,从而诱发宫颈病变。属于阴道菌群失衡的范畴,病情反复难以治愈,长时间的阴道微生态紊乱,可导致阴道微环境 值升高,延长了宫颈上皮细胞的化生期,导致上皮细胞发育不良,为 感染创造良好的条件,增加宫颈病变和宫颈癌风险。目前临床主要通过宫颈液基细胞学检查、进一步病理活检及颈管搔刮明确诊断宫颈病变和宫颈癌,尚缺乏高危 阳性患者宫颈病变之前的预测方法。传统的 回归模型难以处理高维数据,且对数据分布有较严格的假设,数据不满足条件时,预测精度较低。多层人工神经网络分类模型多元共线性不敏感,可根据假设检验结果及临床经验纳入
14、输入变量甚至将个体有关信息全部纳入,有利于减少个体差异,在寻找高效性预测指标中可发挥重要作用。本研究发现,加德纳菌及杂菌、白细胞脂酶是 患者宫颈病变的危险因素,乳酸杆菌和过氧化氢是保护因素。女性生殖道是开放性腔道,寄居着多种病原体,正常情况下以乳酸杆菌为优势菌,较为常见的有卷曲乳杆菌、加氏乳杆菌、詹氏乳杆菌和惰性乳杆菌,该菌群占阴道细菌的 左右,其对维持阴道局部正常微环境具有重要作用。健康女性的阴道清洁度为 度,值为.,乳酸杆菌以糖原为媒介形成乳酸,释放过氧化氢,维持生殖道酸性环境,抑制其他细菌的生长,进而维持阴道处于正常清洁度及酸性环境。此外,乳酸杆菌表面存在的黏附素可定植于生殖道上皮细胞,
15、并通过刺激机体免疫防御来抵抗外来病原体的入侵。古萍等发现随着乳酸杆菌数目的增多,的载量逐渐减少,乳酸杆菌产生的过氧化氢与蛋白抑制剂结核抑制了 的生长。发病使某种专性厌氧菌,例如加德纳菌、普雷沃菌、阿托波菌、巨型球菌和纤毛菌成为优势菌异常增生,乳酸杆菌功能受到影响,导致过氧化氢释放减少,破坏局部免疫微环境的生物屏障,利于 诱发宫颈的系列演变。此外,在女性 注:为 回归模型 为多层人工神经网络分类模型图 两种模型预测效能的 曲线阴道中加德纳菌相较于其他厌氧杂菌,表现出更高的细胞毒性,其可通过形成生物膜、产生阴道溶解素、唾液酸酶、诱导上皮脱落等机制影响疾病结局。白细胞脂酶、唾液酸苷酶与 持续感染和宫
16、颈病变的严重程度密切相关,白细胞脂酶阳性提示阴道分泌物中有大量多核白细胞被破坏,阴道黏膜受损,存在炎症反应。有研究表明,唾液酸苷酶在肿瘤细胞的生存中有重要地位,其高水平表达有利于肿瘤细胞的凋亡,这一发现在未来可能成为宫颈癌治疗的潜在靶点。与传统的统计学方法对数据分布和类型要求对比,多层人工神经网络分类模型具有很强的非线性映射能力,不需要考虑自变量是否满足正态性和变量间独立等条件,还可以根据模拟数学理论对复杂无规律的大规模样本进行量化处理,模型隐藏层数量增多时可将输入变量转化到复杂的非线性空间,以此得到有效向量,分类性能更优。本研究 回归模型预测 发生宫颈病变 曲线下面积为.,灵敏度为.,特异度为.,多层人工神经网络模型预测 发生宫颈病变的 曲线下面积为.,灵敏度为.,特异度为.,多层人工神经网络模型预测效能高于 回归模型,取得令人满意的效果。本研究多层人工神经网络的输入层纳入的 个指标(年龄、病程、清洁度、乳酸杆菌、加德纳菌及杂菌、乙酰氨基葡糖苷酶、唾液酸苷酶、过氧化氢、白细胞脂酶、值)均为妇科阴道微生态检测中的重要指标,在平时的检查中,即可展开宫颈病变和宫颈癌的预测,该预测模型适于在