1、基于改进 YOLOv5 在电力巡检中的目标检测算法研究游越1,伊力哈木 亚尔买买提1,吕怡凡2,赵子凡3(1.新疆大学电气工程学院,乌鲁木齐830046;2.中央民族大学信息工程学院,北京 100081;3.西安理工大学电气工程学院,西安710054)摘要:针对输电线路巡检的复杂场景下被遮挡以及目标较小导致的误检问题,文中提出了一种基于YOLOv5 的改进算法模型。首先通过数据增强和数据扩充数据集进行预处理;其次给引入 SE 模块,加强对不同尺度下目标的特征融合;然后引入 CBAM 模块,进行进一步特征提取,使提取的特征信息更加突出。最后,对损失函数进行优化,改进小数据导致的样本不均衡现象。经
2、实验证明,改进后的算法有效地提高了被遮挡的目标和小目标的识别率,mAP较原算法精度提高了 5%,Recall 提高了 14.6%。与其他改进模型相比,精度、召回率都有提高,验证了该模型在各种场合下具有较强的鲁棒性和泛化能力。关键词:输电线路巡检;遮挡;YOLOv5;CBAM;SEResearch on Target Detection Algorithm Based on Improved YOLOv5 in PowerPatrol InspectionYOU Yue1,YILIHAMU Yaermaimaiti1,LYU Yifan2,ZHAO Zifan3(1.SchoolofElectr
3、icalEngineering,XinjiangUniversity,Urumqi830046,China;2.SchoolofInformationEngineering,MinzuUniversityof China,Beijing 100081,China;3.School of Electrical Engineering,Xi an University of Technology,Xi an 710054,China)Abstract:In view of false detection due to sheltering and small target in complex s
4、cenes of patrol inspection of transmission,a kind of improved algorithm model based on YOLOv5 is proposed in this paper.First,preprocessing is carried out through data enhancement and data expansion data set.Then,the SE module is introduced to strengthen thefeature fusion of targets at different sca
5、les.After that,the CBAM module is introduced for feature extraction furtherso to make the feature information more prominent.Finally,the loss function is optimized to improve the sample imbalance due to small data.It is proved through experiments that the improved algorithm effectively improves the
6、recognition rate of sheltering targets and small targets.The accuracy of mAP,compared with the original algorithm,isimproved by 5%and Recall is improved by 14.6%.Compared with other improved models,both precision and recallrate are improved,verifying that the model has strong robustness and generali
7、zation ability in various occasions.Key words:patrol inspection of transmission line;sheltering;YOLOv5;CBAM;SE0引言近年来,深度学习和无人机领域发展迅猛,给计算机视觉与电力行业的融合奠定了基础。无人机巡检也就是在这种情况下应运而生。目前,无人机的检测方法主要有 4 种1。通道检查,即探测出电力管道附近的工程事故和特定事故;高压输电线路的精细扫描;巡检故障区域,并对其破坏程度及原因进行分析;自然灾害时的特殊工作,调查高压电源线的损坏,损伤区域及损坏程度。当使用无人机巡视时,可以用无人机对
8、杆塔、金具等进行细致的观测,从而避免人工检查时由于视觉上的误差和光学元件本身的缺陷。但是,在无人机巡检过程中在对目标进行自动识别时,存在目标互相遮挡和目标太小的问题,很容易造成误检和漏检。事实上,从计算机视觉研究诞生之初就一直饱受遮挡目标识别问题的困扰2。在目标识别中,普遍将轮廓2-3、纹理、角点等信息为重点,如果特征信第59卷第2期:008900962023年2月16日High Voltage ApparatusVol.59,No.2:00890096Feb.16,2023DOI:10.13296/j.10011609.hva.2023.02.012_收稿日期:20220812;修回日期:2
9、02210182023年2月第59卷第2期息不完整或者完全丢失,就会对目标识别造成极大的困扰4-5。例如在家用机器人扫描寻找目标时,就会因为复杂的环境,如物品堆叠、相互遮挡,丢失部分甚至全部特征信息,导致机器人的识别错误。针对静态目标遮挡问题,学者们更多的注重于对目标的表面特征进行分析,或利用不同特征的关联性进行分析,如:文3中对轮廓与接合点的关系进行了分析,对高比例遮挡物体进行识别。识别率并不是很高,且无法识别较小目标;文6中为了克服遮蔽和光照的双重效应,将SIFT 特性与粒子滤波相结合,有效地减少了光照和遮挡的干扰,但识别速度较慢,实时性较低。还有一些学者对全局与局部特征之间的关联进行分析
10、,利用它们之间的关联性来补充丢失的特征,这样就可以降低遮挡干扰的影响。例如:文7中采用 HSV颜色空间内散落的大部分特征点,与 SIFT 局部特征进行匹配,以来实现对遮挡目标的定位,但是依然存在漏检问题;文8中则是遍历匹配了全局特征和局部特征,采用直方图、区域、灰度等特征,实现循环遍历的分块匹配,然而识别率还有待提高,且内存较大。随着深度学习的发展,目标检测算法也进行了优化,目前主流的目标检测算法大体可以分为两类,分别是 onestage(单阶段)和 twostage(双阶段)。twostage 中具有代表性的是fasterRCNN9-10、maskRcnn 系列,而 onestage 下最具
11、代表性的检测算法9-10是 YOLO 系列。由于电力巡检采集到的照片通常存在互相遮挡的情况,且小物体较多,而 YOLO 系列算法恰好在这种情形下具有其独特的优势,能够实现对小物体和分布集中目标的准确识别。因此 YOLO 系列算法更符合文中对遮挡物体识别的需求。1算法简介1.1 YOLOv1YOLOv4最初的 YOLOv1 版本的实现是通过在网络中进行相关图片的输入,并在卷积神经网络的帮助下实现对检测结果和边界框偏移量的测量。这样以来,其虽然能够保障较快的检测速度,但精度低,在小目标检测方面性能较差。而在 YOLOv1 的基础上进行相应的升级,得到了具有 BN 层和锚机制的YOLOv2 版本。此
12、外,该版本还对原有的池化层结构和全连接层结构进行了丢弃和移除。YOLOv3 是YOLOv2 的进一步增强版本。这一版本为了实现特征提取,选择了 darknet53,对原有的 darknet19 网络结构进行替换。这样一来,在特征金字塔网络的帮助下不仅能实现对拥有不同尺度物体的检测,还能够对类别和边界框的偏移进行一定的预测。在YOLOv3 之后,有一个升级的 YOLOv411。这一版本在网络结构方面并没有做出较大的改动,但在检测速度和检测量上都有一定的提升12。1.2 YOLOv5YOLOv5 相较于之前几个版本,网络结构中Focus 模块的加入是其显著的特点12。Focus模块的主要功能是切片
13、,即 Focus 模块对尚未进入到主干网络的图像进行相应的处理。这样一来,不仅能够保障图像的信息完整性,也同时完成了图像的采样工作。在之后,在 Backbone的 CSP 的帮助下,网络完成了局部跨层融合的工作。不仅如此,neck 部分的SPP 和 head 部分也能够分别完成感受野增加和多尺度输出的工作。因而,综合以上功能,这一版本不仅能够实现快速检测速度基础上的小目标高检测准确率。相应的YOLOv5 结构图12见图1。图 1YOLOv5 结构图Fig.1YOLOv5 structure diagram90YOLOv5 的原始模型中有3 种损失函数,分别为分类损失(cls_loss)、定位损
14、失(box_loss)、置信度损失(obj_loss),这 3 个指标极大程度上决定了模型的性能。其中,定位损失表示的时预测框与标定框之间的误差 GIoU。置信度损失是通过IoU 函数计算出来的,解决的是两个物体重叠的情况,为了解决IoU损失函数不与检测框重叠时的梯度问题,引用GIoU函数13。其公式为:GIoU=IoU-|Ac-U|/|Ac|(1)LGIoU=1-IoU(2)式(1)、(2)中:IoU为预测框与目标框的交集和并集比;Ac为最小闭包;U为预测框与目标框的并集。此外,默认框以 kmeans 算法作为主要支撑,能够实现超参 k 的自动获取工作。由此可以看出,自适应 anchor 是
15、该算法的一大特征。YOLOv5 按 大 小 分 为 4 个 模 型,YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,各模型对比见图213。图 2YOLOv5 各模型对比Fig.2Comparison of YOLOv5 models图 2 中,无论是 YOLOv5s,YOLOv5m,YOLOv5l,还是 YOLOv5x,他们的主要组件Backbone,Neck 和Output 都是相同的。其不同点在于模型深度和宽度的相关设置存在一定的差异性。其中 YOLOv5s速度最快,然而在模型小的基础上并没有兼顾到足够的精度。YOLOv5x 虽然弥补了精度上的不足,但速度最慢。经过对比,文
16、中最终选择了 YOLOv5s 作为基础模型。2改进的YOLOv5模型设计2.1 SE模块为了增强网络对特征的提取,文中给系统的主干网络卷积层间引入注意力机制 SE 模块。SE 模块在对各通道权值的计算后,得到不同通道的重要程度。这样就可以注意到更为重要的特征,从而为注意力机制的后续发展奠定了良好的基础14。SE模块的优点在于,其对于网络性能的提高并不是以打乱原有主体作为牺牲的代价,相反,其能够实现在原有网络上的增添工作。具体操作步骤14见图 3(P 图)。图 3SE 操作步骤Fig.3SE Module输入特征图大小为WHC。图3中:W,H表示特征图宽,高;C表示 通道 数。其具体操作步骤为:1)压缩(Squeeze)。其过程为全局平均池化(global average pooling)。特征图在对每一个通道的FeatureMap 经过相应的压缩工作后可以得到 11C的向量。2)激励(excitation),见图4。图 4SE 激励操作Fig.4SE incentive operation两个连接层共同构成了激励操作,其神经元数分别为 C*SERatio 和 C。对于前者来说,若输入