1、第 31 卷 第 4 期 2023 年 8 月Vol.31 No.4Aug.2023电脑与信息技术Computer and Information Technology文章编号:1005-1228(2023)04-0031-03改进 DeepLabV3+的农作物病害分割方法余文杰(长江大学,湖北 荆州434023)摘要:针对于传统农作物病害识别存在的效率低、难度大等问题,提出了一种改进 DeepLabV3+网络的农作物病害分割方法。主干特征提取网络使用轻量级的 MobileNetV3,在空洞空间金字塔池化(ASPP)中使用深度可分卷积替代普通卷积,减少模型计算量;引入 SE 通道注意力和 EC
2、A 有效通道注意力,挖掘有效的通道信息来提高分割精度。以某地区的苹果叶片病害图像作为研究对象。实验结果表明,改进的 DeepLabV3+算法平均交并比可达到 82.7%,而且模型参数量只有 4.98MB,具有较好的性能。关键词:语义分割;农作物病害分割;DeepLabV3+;深度可分卷积;有效通道注意力;中图分类号:TP391.4文献标识码:AImproved Crop Disease EgmentationMethod of DeepLabV3+YU Wen-jie(Dept.Yangtze University,Jingzhou 434023,China)Abstract:Aiming a
3、t the problems of low efficiency and difficulty in traditional crop disease iden-tification,an improved method of crop disease segmentation based on DeepLabV3+network is proposed.The backbone feature extraction network uses lightweight MobileNetV3.In the empty space pyramid pooling(ASPP),the depth d
4、ivisible convolution is used to replace the ordinary convolution,reducing the amount of model calculation;SE channel attention and ECA effective channel attention are introduced to mine effective channel information to improve segmentation accuracy.The image of apple leaf disease in a certain area w
5、as taken as the research object.The experimental results show that the improved DeepLabV3+algorithm can achieve 82.7%of the av-erage cross merge ratio,and the model parameters are only 4.98MB,which has good performance.Key words:semantic segmentation;crop disease segmentation;DeepLabV3+;depthwise se
6、parable convolu-tion;effective channel attention收稿日期:2022-10-20作者简介:余文杰(1999-),男,湖北潜江人,硕士,主要研究方向:计算机视觉。农作物在生长过程中,容易受到天气、害虫等因素的侵扰,导致患上各类疾病,如果不及时救治,农作物产量和质量都会大打折扣。传统的农作物的病害识别方法,主要还是依赖历代农民实践中积累的经验进行判断。这样在判断农作物病害时,难免会出现错误,造成误治农作物的情况。另外,在农作物种植过程中,需要农业人员每天去观察农作物的生长状况,耗时耗力且效率低下。因此,当今的农业生产需要更加高效、便捷的农作物识别方法来
7、改变现状1。近年来计算机硬件和大数据技术飞速发展,深度学习得到了技术支持,也开始蓬勃发展。语义分割就是深度学习中图像处理和机器视觉的一个重要分支,该技术识别精度高、检测速度快。将语义分割应用到农作物病害识别上能够有效解决上述提到的传统农作物识别的问题,及时发现农作物患病情况,减少人力物力的消耗,提高农作物的产量,逐渐实现农业信息化。但是传统的语义分割模型的参数量都比较大,如全卷积网络(FCN)、SegNet、U-Net、金字塔场景解析网络(PSPNet),DeepLabV3+等。这让它们难以部署在移动和嵌入式应用中,如果不能应用嵌入式设备中,那么使用语义分割来识别农作物病害仍然是不切实际的。基
8、于上述研究,本文提出了一种基于改进DeepLabV3+的轻量级语义分割模型,该模型很好地兼顾了参数量和性能 2 个方面。网络使用MobileNetV3 作为主干特征提取网络,在空洞空间卷DOI:10.19414/ki.1005-1228.2023.04.022电脑与信息技术 2023 年 8 月32积池化金字塔 ASPP(Atrous Spatial Pyramid)模块2中使用深度可分卷积替代普通卷积来减少模型计算量;引入 SE(Squeeze-and-Excitation)通道注意力3,有效通道注意力 ECA(Efficient Channel Attention)模块4,挖掘有效的通道信
9、息来还原目标边界,提高分割精度5。1改进的 DeepLabV3+语义分割模型1.1整体模型改进的 DeepLabV3+语义分割模型仍然是编码器-解码器结构。模型整体结构如下图 1 所示。(1)编码器部分:负责提取输入模型的数据的特征信息。编码器由特征提取模块和多尺度并行模块组成,本文模型在原有模型的基础上改进了三部分,特征提取模块不再使用 Xception 模型而是使用更轻量级的 MobileNetV3 模型,引入 SE 通道注意力机制改进编码器,使编码器捕获更丰富的多尺度信息。(2)解码器部分:会利用主干特征提取网络的底层特征与经过多尺度并行模块的高层特征进一步融合,沿着物体边界进行优化,逐
10、步恢复空间信息。本文模型在解码器部分也进行了改进,加入了有效通道注意力模块,让解码器使用注意力模块得到的更为重要的特征来恢复空间信息,提高模型分割准确率。图 1 改进 DeepLabV3+网络整体结构图1.2特征提取模块编码器部分的特征提取模块使用 MobileNetV36网络,MobileNet 使用深度可分卷积代替普通卷积,深度可分卷积在理论上所使用的计算量是普通卷积的 1/9,使用这种卷积让网络的计算量与其他传统卷积网络相比要小很多,所以 MobileNetV3 相比于Xception 参数量更少,模型训练耗时更短,模型复杂度更低,收敛更容易。1.3改进的编码器除了 DeepLabV3+
11、特征提取网络的高层特征图进入 ASPP 模块这一条分支之外,在本文模型中又加入了一条分支,这条分支使用 SE 通道注意力对高层特征图进行处理,从而让模型自动学习到不同 channel特征的重要程度,经过 SE 处理后的特征图与经过ASPP 模块的特征图以相加的方式进行特征融合,提取更丰富的上下文信息,有利于解码器提高分割准确率。1.4改进的解码器为了让解码器更好地还原分割目标,本文模型在解码器部分加入了另外一种通道注意力模块,有效通道注意力模块 ECA。ECA 模块的思想非常简单,去除原来 SE 模块中的 FC 层,直接对全局平均池化之后的聚合特征使用一维卷积学习通道权重关系。在改进的解码器结
12、构中,首先对本文特征提取网络下采样两倍的低层特征图使用 ECA 进行处理,将处理后的结果与多尺度并行模块输出的高层特征图拼接后的结果,再次送入 ECA,这时得到的特征图充分地挖掘了有效的通道信息,能够提高模型的分割准确率。2实验结果与分析实验数据集使用的是某地区正常苹果叶片以及患有不同疾病的苹果叶片的图像,该数据集包含 5 个对象类别和一个背景类别,包括苹果斑点落叶病树叶、苹果褐斑病树叶、苹果灰斑病树叶、苹果锈叶病树叶和正常苹果叶片。数据集一共 2580 张图像,按照 7:3的比例,分为训练集 1806 张,验证测试集 774 张。2.1消融实验为了验证通道注意力机制 SE,ECA 注意力机制
13、融合低级特征和高级特征的有效性,所以在实验环境相同的情况下,设置了相应的消融实验。表 1SE 通道注意力的消融分析Network ModelParameters /MB FLOPS/GFLOPmIOU/%BM4.65123.5177.80BM+SE4.74823.5478.51实验结果见表 1,其中 BM 表示基准模型,基准模型的特征提取网络为 MobileNetV3,多尺度并行模块的 ASPP 使用深度可分卷积。SE 为是否使用通道注意力机制。从表中可以看出,使用 SE 模块后,参数量和浮点计算量分别仅提高了 0.097 和 0.03,mIou却提升了 0.71%,从而验证了 SE 模块在本
14、模型的有效性和轻量性。第 31 卷 第 4 期33余文杰,改进 DeepLabV3+的农作物病害分割方法表 2有效通道注意力的消融分析Network ModelParameters /MB FLOPS/GFLOPmIOU/%BM4.65123.5177.80BM+ECA4.65323.5278.93从表 2 中可以看出,在基准模型上添加 ECA 模块时,mIou 有明显提升,但是参数量和 FLOPS 基本上不增加,从而证明了通过 ECA 模块处理得到的特征图能够充分地挖掘了有效的通道信息,能够提高模型分割准确率。通过上述消融实验可以证明本文提出的改进模块都能够在小幅提高参数量和 FLOPS 的
15、基础上,提高模型的分割准确率,说明这些改进模块的有效性。3.2不同分割方法性能分析为了更好地验证本文改进模型的性能,将本文改进模型与目前比较流行的语义分割网络进行对比。实验结果见表 3。表 3不同算法性能对比Network ModelBackboneNetworkParameters /MBmIOU/%PSPNetPaper source84.7585.42SegNetPaper source29.4680.95DeepLabV3+Xception54.7386.20Proposed NetworkMobileNetV34.9482.67从表 3 中可以看出,相比其他流行的语义分割网络,本文提
16、出的改进模型性能并不差,比 SegNet在 mIOU 上提高了 1.72%。相比于 PSPNet 和基于Xception 的 DeepLabV3+模型差距也并不明显,并且本文提出的改进模型的参数量只有 4.96MB,只有DeepLabV3+模型参数量的 1/11。因此本文所提模型属于轻量级的网络,而且在本文所使用的苹果病害数据集上分割精度和目前流行的语义分割网络差距很小,说明本文模型在分割精度和模型参数量之间实现了较好的平衡。3.3算法分割结果这里将 DeepLabV3+与本文改进模型对于苹果病害数据集的分割结果进行可视化展示,如图 2 所示。其中黑色代表背景,红色代表正常苹果叶片,紫色代表苹果褐斑病,黄色代表苹果斑点落叶病,绿色代表苹果锈叶病,蓝色代表苹果灰斑病。由这两种模型的分割效果可知,本文改进模型对于各类叶片疾病能够实现有效的分割,分割结果接近真实标签;对于一些患病部位微小的地方,本文模型不能很好地进行分割。但是本文模型与 DeepLabV3+的表现差距不大,模型参数量和计算量却比 DeepLabV3+要小很多,说明本文模型的性能还是比较不错的。图 22 种分割算法分割效果对比