1、现代计算机Modern Computer第 28 卷 第 24 期2022年12月25日文章编号:1007-1423(2022)24-0052-05DOI:10.3969/j.issn.1007-1423.2022.24.009基于CAMCGU-Net网络的CT图像肺实质分割算法杜佳成,余艳梅,汪恩惠,陶青川(四川大学电子信息学院,成都610065)摘要:肺癌的及时诊断和治疗能够降低肺癌病人的死亡率,目前的主要诊断方法是采用计算机断层扫描(computer tomography,CT)技术,CT具有更高的分辨率和灵敏度,能够正确检测肺部中病灶位置。基于CT图像的肺实质准确分割是临床肺部疾病诊断
2、的一个重要任务。针对肺实质分割时特征信息易丢失、前景和背景易混淆的问题,改进并提出了一种融合协调注意力和密集连接的空间卷积块的深度学习模型CAMCGU-Net(coordinate attention multi-level context gating U-Net)。主要改进如下:在编码器和解码器中间引入密集连接的空洞卷积块,帮助模型获取丰富多尺度特征信息,减少特征信息的丢失;在上采样后加入协调注意力(coordinate attention,CA)模块,高效整合空间坐标信息、增强目标对象的表示以提高模型对前景区域的定位能力,避免前景和背景混淆。在Kaggle肺分割数据集上的实验结果显示提出
3、的模型得到的结果更加接近标注图像,在准确率(Accuracy,ACC)、特异性(Specificity,SP)、F1分数(F1Score)等评估指标上均优于对比方法,能够更有效地分割肺实质。关键词:计算机断层扫描;肺实质分割;协调注意力0引言肺癌是我国第一大癌症,发病率较高1。研究发现,及时诊断和治疗能够减少肺癌病人的死亡率2。相比X射线,CT能准确观察到病灶位置,为早期肺癌诊断提供准确的诊断依据3。然而每次CT断层扫描都会生成几百帧肺CT图像,给医生诊断带来挑战。准确分割肺实质能帮助医生快速定位病灶,为后续肺结节检测、肺功能评估创造条件,辅助医生快速诊断病情。基于深度学习的肺实质分割算法速度
4、更快,精度更高,是目前研究的热点。Ronneberger等4提出一种对称的编解码模型UNet,编码器利用下采样缩小特征图分辨率,捕获上下文信息,解码器利用上采样恢复图像分辨率,二者用跳跃连接相连,保证解码器在上采样时能够融合更多高层特征图包含的高分辨率细节信息,目前已成为医学图像分割的主流结构。Alom等5提出了一种基于UNet模型的递归卷积神经网络 RUNet和一种基于 UNet模型的递归残差卷积神经网络R2UNet,利用递归残差卷积层增强 网 络 提 取 特 征 的 能 力,增 加 网 络 深 度。AsadiAghbolaghi 等6提出一种具有密集连接卷积和双向卷积LSTM(long s
5、hortterm memory)7分割模型MCGUNet,双向卷积LSTM以非线性的方式将上采样后的特征图与相应编码器输出的特征图相结合,同时使用密集连接卷积加强特征传播。注意力机制已被广泛应用于提高网络模型性能8,其基本思想是让网络像人一样聚焦于重点信息,即把注意力放在感兴趣区域上。Oktay等9提出的Attention UNet,利用注意力机制让 U-Net模型更集中于前景像素,提高了模型的分割性能。然而现有的注意力机制通常采用平均池化或最大池化来处理通道,计算量大且会丢失空间信息。协调注意力机制10避免既考虑通道之间的关系,也考虑特征空间中的位置信息,能够有效加强对前景信息的特征表示。密
6、集连接卷积11能帮助网络学习一组不同的特征图,允许信息在网络中流动以提高网络的表示能力。空洞卷积能够在扩大感受野的同时保持较高分辨率12,帮助模型精确定位前景 52杜佳成等:基于CAMCGU-Net网络的CT图像肺实质分割算法第24期像素。Gu等13提出的密集空洞卷积模块,利用多尺度空洞卷积提取丰富的特征表示。目前 MGCUNet6模型在 LUNA16数据集和Kaggle肺分割数据集取得了较优的结果,但其在边缘细节上的分割效果不太理想,存在以下问题:未充分利用上下文信息,连续经过 4次下采样容易丢失特征信息,影响分割效果。肺部CT图像背景信息复杂导致模型容易混淆前景和背景像素,降低边缘分割精度
7、。针对以上问题,本文提出了一种基于MGCUNet改进的肺实质分割网络 CAMCGUNet。主要有以下两方面的贡献:(1)在上采样层后加入协调注意力模块,增强模型对于特征信息的学习能力,帮助网络更好地定位感兴趣区域,减少背景区域,提高模型的分割精度。(2)在密集连接卷积层的基础上增加空洞卷积,编码器输出后连接4个密集连接的空洞卷积块,帮助模型获取多尺度特征信息。1基于MCGUNet改进的肺分割模型框架本文基于MCGUNet改进的CAMCGUNet网络模型如图1所示,其中在MCGUNet框架上新增的协调注意力模块和密集连接的空洞卷积块用虚线框框出。整个模型包含编码器和解码器,二者中间使用4个密集连
8、接的空洞卷积块连接,帮助网络提取丰富多尺度特征信息,避免梯度爆炸。编码器主要从输入图像中提取特征信息,它由卷积层和最大池化层组成,通过不断缩小特征图的空间尺寸来学习细节特征信息。解码器将编码器输出的特征信息进行进一步的优化,它由上采样层和协调注意力模块组成,上采样层将经过编码器后缩小的特征图恢复到原来的尺寸,以便于进一步的分割计算。协调注意力模块能够帮助解码器更好地定位到感兴趣区域,增强网络学习特征的表达能力。CAMCGUNet模型中使用双向卷积LSTM加权融合相应编码器和解码器的特征图,更好地平衡来自不同尺度的特征,以提升分割精度。CABconvLSTMBconvLSTMBconvLSTMB
9、convLSTMBconvLSTMBconvLSTMCACADilated Conv 3*3,Relu,Conv 3*3,ReluMax pool 2*2BNCopyCoordinate AttentionUp-Conv 2*2CA图 1CAMCGU-Net网络模型2算法介绍本文提出的肺实质分割网络 CAMCGUNet的主要改进如下:在上采样后引入了协调注意力模块,以帮助模型聚焦于前景像素;同时在原密集连接卷积块中引入了空洞卷积,以帮助模型捕获多尺度特征信息。下面将分别介绍协调注意力模块和空洞卷积模块。2 2.1 1协调注意力模块协调注意力模块协调注意力模块的示意图如图2所示,它能高效整合空间
10、坐标信息,分别获取图像在高度和宽度上的注意力并对准确位置信息进行编码,能对网络中的任意中间特征张量进行转换并输出相同尺寸的张量。53现代计算机2022年图 2协调注意力模块示意图102 2.2 2密集连接的空洞卷积模块密集连接的空洞卷积模块本文在密集连接卷积的基础上增加空洞卷积,来帮助模型获取多尺度特征信息。具体来说,本文将两个空洞卷积层作为一个密集连接的空洞卷积块,在编码器的最后一个卷积层中,连接4个密集连接的空洞卷积块,如图3所示。帮助模型获取丰富多尺度特征的同时,避免梯度爆炸。第i个密集空洞卷积块的输入xie如公式(1)所示:xie=j=1i-1xjp(1)式中xjp为第j个密集空洞卷积
11、块的输出。Block 1Block 2Block 3Block 4图 3CAMCGU-Net中的密集空洞卷积模块3实验结果与分析3 3.1 1实验环境实验环境本文实验采用的硬件设备和软件环境如表1所示。表 1实验环境设备中央处理器(CPU)图形处理器(GPU)操作系统编程语言深度学习框架名称Intel(R)Xeon(R)Silver 4210RCPU 2.40GHzNVIDIA RTX 3090(24 GB)Ubuntu 18.04.5Python 3.8Keras 2.5.0rc0,Tensorflow-gpu 2.5本次实验训练和验证的 batch size 均为 4,总共训练200个批次
12、。实验中使用早停法(EarlyStopping)来避免训练批次过多导致出现模型过拟合。具体做法是在每个批次结束后,在验证集上进行测试,如果验证精度连续10个训练批次均无增加,则停止训练,避免模型因训练过多导致过拟合。合适的学习率能够帮助模型在较短时间内收敛到局部最小值,本文使用 Keras 库中 ReduceLROnPlateau方法配合早停法一起使用,避免因初始学习率过大导致训练后期模型性能不再提升。具体来说,如果验证损失在5个训练批次都没有下降,模型会自动降低学习率继续训练,从而继续提升模型性能。通过两种方法的配合使用,可以快速精确地获得最优模型。3 3.2 2数据集数据集本次实验采用20
13、17年Kaggle数据科学碗中提供的肺分割数据集,该数据集内同时包含二维和三维肺分割CT图像,且均带有手动标注,专门用于肺实质分割。图 4为 Kaggle 肺数据集中的示例,左边是原始肺CT图像,右边是手工 54杜佳成等:基于CAMCGU-Net网络的CT图像肺实质分割算法第24期标注的肺实质图像。我们将70%的数据用于训练集,剩下30%的数据用于测试集,每张图片的尺寸为512512。(a)肺CT图像(b)肺实质图像图4Kaggle lung数据集示例3 3.3 3评估指标评估指标本次实验采用3个常用的图像分割评估指标用于评估模型的分割效果:准确率(ACC)、特异性(SP)和F1分数。ACC表
14、示模型预测正确的样本占总样本的比例,SP表示正确预测为背景的样本占总背景的比例,F1分数是精确率和召回率的调和平均。3 3.4 4实验结果分析实验结果分析为了充分检验本文提出的CAMCGU-Net模型的有效性,我们将 CAMCGUNet 和一些主流的 肺 实 质 分 割 模 型,如 UNet、RUNet、R2UNet、MCGUNet进行了比较,实验结果如表2所示。表 2实验结果MethodsU-Net4RU-Net5R2U-Net5MCGU-Net6CAMCGU-Net(本文)F10.96580.96380.98320.98480.9873SP0.98720.98660.98320.99550
15、.9977ACC0.98720.98360.99180.99410.9952实验结果表明,本文提出的 CAMCGUNet模型在F1分数,SP和ACC上均取得了更好的效果,相比于性能次之的MCGUNet模型,F1分数提升了0.25个百分点,SP提升了0.22个百分点,ACC 提升了 0.11 个百分点,说明本文提出的CAMCGUNet模型在肺实质的分割上性能更优。4结语本文提出一种基于MCGUNet的肺实质分割模型 CAMCGUNet,在 Kaggle 肺分割数据集上进行了对比实验。实验结果表明,本文提出的模型在评估指标上均取得了更好的性能。参考文献:1 赫捷,李霓,陈万青,等.中国肺癌筛查与早
16、诊早治指南(2021,北京)J.中国肿瘤,2021,30(2):81-111.2 刘婧,张莺.基于深度学习的计算机辅助诊断系统在肺癌早期诊断中的应用与进展 J.国际放射医学核医学杂志,2020(1):22-26.3 李丹.低剂量螺旋CT检查在早期肺癌诊断中的应用分析 J.中国医疗器械信息,2022,28(5):57-59.4 RONNEBERGER O,FISCHER P,BROX T.Unet:convolutional networks for biomedical image segmentation C International Conference on MedicalImage Computing and ComputerAssisted Intervention.Springer,Cham,2015:234-241.5 ALOM M Z,HASAN M,YAKOPCIC C,et al.Recurrent residual convolutional neural network basedon Unet(R2UNet)for medical image segment