1、Application 创新应用390 电子技术 第 52 卷 第 6 期(总第 559 期)2023 年 6 月法,它在YOLOv3的基础上进行了一系列的改进,旨在提高检测准确性和速度。其网络结构主要由input、backbone和head三部分组成,与之前v5版本不同的是,其将neck层与head层合称为head层,功能与v5版本相同。输入图像经过input输入层预处理后送入到backbone网络中提取目标特征,根据backbone网络的三层输出,在head层通过RepVGG block和conv层对图像检测的三类任务(分类、前后背景分类、边框)预测,输出最后的结果。3 K-means+聚
2、类算法YOLOv7模型在训练之前需要设定锚框大小,不同数据集目标大小分布不同,锚框设计的好坏一定程度上影响了模型收敛的速度和网络最终的检测性能。因此我们引入了K-means+4算法。算法在初始中心点选取上更加科学。首先随机选取一个样本作为第一个聚类中心,然后计算每个样本与现有的聚类中心最短距离,将样本分类到距离最近的聚类中心对应样本中。与此同时,计算每个样本被选作下一个聚类中心的概率值,按照轮盘法选择出下一0 引言在钢产品的生产过程中会出现各种表面缺陷,表面有缺陷的产品不仅影响其外观,而且还会影响其内部结构和性能。因此,对钢产品成品出厂前检测缺陷任务显得尤为重要。1 研究背景目前,对钢表面缺陷
3、检测已经有了一些相关研究。如段聪昊1针对传统方法检测效果差的问题,提出一种改进YOLOv3的目标检测算法,通过改进YOLOv3的Batch Normalization层和损失函数有效地提高了检测精度。韩强2针对深度学习算法检测钢表面缺陷时结构信息减少导致检测精度低的问题,提出了一种特征融合和级联检测网络的Faster R-CNN钢表面缺陷检测算法。上述研究一定程度上提高了钢表面缺陷检测精度,但是检测速度并不能达到实时检测。本文针对该问题,提出了一种基于改进YOLOv7的钢铁表面缺陷检测方法。2 YOLOv7算法YOLOv73是一种基于深度学习的目标检测算基金项目:国家自然科学基金(F62271
4、502,F62171463)。作者简介:张磊,中国人民解放军陆军工程大学;研究方向:缺陷检测。收稿日期:2023-05-19;修回日期:2023-06-12。摘要:阐述一种基于改进YOLOv7的钢表面缺陷检测方法,通过引入K-means+聚类算法提高网络检测精度,利用FReLU替换原有的激活函数增强网络的空间灵敏度,引入了CBAM注意力机制,提高网络对缺陷目标的关注度。关键词:表面缺陷检测,YOLOv7算法,FReLU,CBAM注意力机制。中图分类号:TP391.4文章编号:1000-0755(2023)06-0390-02文献引用格式:张磊,黄忠虎,徐智勇,汪井源,李建华,赵继勇,王艺敏.基
5、于改进YOLOv7算法的钢表面缺陷检测方法J.电子技术,2023,52(06):390-391.基于改进YOLOv7算法的钢表面缺陷检测方法张磊1,黄忠虎2,徐智勇1,汪井源1,李建华1,赵继勇1,王艺敏1(1.中国人民解放军陆军工程大学,江苏 210001;2.福建理工大学交通运输学院,福建 350108)Abstract This paper describes a steel surface defect detection method based on improved YOLOv7,which improves the network detection accuracy by i
6、ntroducing K-means+clustering algorithm,uses FReLU to replace the original Activation function to enhance the spatial sensitivity of the network,and introduces CBAM attention mechanism to improve the networks attention to defect targets.Index Terms surface defect detection,YOLOv7 algorithm,FReLU,CBA
7、M attention mechanism.Steel Surface Defect Detection Method Based onImproved YOLOv7 AlgorithmZHANG Lei1,HUANG Zhonghu2,XU Zhiyong1,WANG Jingyuan1,LI Jianhua1,ZHAO Jiyong1,WANG Yimin1(1.Peoples Liberation Army Ground Force Engineering University,Jiangsu 210001,China.2.School of Transportation,Fujian
8、University of Technology,Fujian 350108,China.)Application 创新应用电子技术 第 52 卷 第 6 期(总第 559 期)2023 年 6 月 391个中心,重复上述2个步骤直至选出K个中心点。概率计算如式(1)所示。(1)4 CBAM注意力机制钢表面缺陷数据集中真实缺陷特征会分布在不同的通道和空间上,导致网络在检测过程中过度的浪费资源,影响网络的检测性能。为了解决这一问题,本文引入了CBAM混合注意力,从空间和通量两个维度提取和融合特征,并赋予检测目标更高的权重,以提高网络的感知能力和判断能力。CBAM详细结构如图1所示。5 FReLU
9、激活函数原始YOLOv7网络中使用了SiLU激活函数,其表达式如式(2)所示。(2)SiLu函数之所以能够作为激活函数,是因为它连续且处处可导,在深度学习的模型中能够有效提高模型的分类准确率,但由于指数函数的存在导致其计算量倍增。因此,我们考虑使用FRelU激活函数。FReLU5通过添加可忽略的空间条件开销将ReLU和PReLU扩展到2D激活,提升了空间敏感性。SiLU激活函数和FReLU激活函数图像如图2和图3所示。FReLU表达式如式(3)所示。(3)其中,a和m是可学习的参数。当x0时,f(x)=x;当x0时,f(x)=a(x-m)。6 实验环境及结果分析本次实验使用具有以下配置的计算机
10、:Ubuntu 22.04操作系统,搭载了两颗Inter(R)Xeon(R)Gold52182.10GHz处理器和NVIDIA GeForce RTX3090 24G显卡。实验数据为东北大学NEU-DET数据集,该数据集包含六种缺陷。将数据集按照8:2划分训练集和测试集,再将训练集按照8:2的比例划分为训练和验证。训练优化器选择SGD,动量设置为0.937,初始学习率为1e-2,最小值为1e-4,采用余弦退火学习率衰减策略。训练分为冻结和解冻两个部分,冻结训练批次设为8,解冻训练批次设为16。为了验证本文所提出改进策略相较于原始网络有性能提升,我们在相同的实验设置条件下做了如下的对比实验。(1
11、)训练原始的YOLOv7模型。(2)使用K-means+算法聚类缺陷样本真实框,将网络中的SiLU激活函数替换为FReLU。(3)在上个实验的基础上,在backbone骨干网络的三个输出端和最大输出特征图对应的检测头前端嵌入CBAM注意力模块。得出的结论如表1所示。正如表1所示,引入K-means+和修改激活函数,在增强激活空间灵敏度的同时提高了检测性能,与原始YOLOv7相比mAP值提高了1.42%。在该模型的基础之上,又将CBAM注意力机制模块引入到网络中,mAP值提高了2.29%。最终的网络性能相较于原始YOLOv7提高了3.71%。7 结语为了解决钢表面缺陷检测中速度慢的问题,本文中提
12、出了一种基于YOLOv7的钢表面缺陷检测方法,旨在实现高效而准确的钢材表面缺陷检测。实验结果表明,此方法能够可靠地识别各类缺陷,并且在准确率方面取得了令人满意的成果。参考文献1 段聪昊,王西峰,姬丽娟等.基于改进YOLOv3的钢卷端面缺陷检测应用研究J.制造业自动化,2021,43(12):185-188.2 韩强,张喆,续欣莹等.基于FF R-CNN钢材表面缺陷检测算法J.太原理工大学学报,2021,52(05):754-763.3 Wang C Y,Bochkovskiy A,Liao H Y M.YOLOv7:Trainable bag-of-freebies sets new stat
13、e-of-the-art for real-time object detectorsC.Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition,2023:7464-7475.4 Arthur D,Vassilvitskii S.K-means+the advantages of careful seedingC.Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms,2007:1027-1035.5 Qiu S,Xu X,Cai B.FReLU:flexible rectified linear units for improving convolutional neural networksC.2018 24th international conference on pattern recognition(icpr),IEEE,2018:1223-1228.图1 CBAM注意力机制结构图 图2 SiLU图像 图3 当a=2,m=1时FReLU图像表1 对比试验结果