扩展YOLOv5安全帽多级目标分类检测

资源描述

1、扩展 YOLOv5 安全帽多级目标分类检测金源1,张长鲁21(北京信息科技大学计算机学院,北京100101)2(北京信息科技大学经济管理学院,北京100192)通信作者:金源,E-mail:摘要:YOLO 是目前计算机视觉目标检测领域比较重要的算法模型之一.基于现有 YOLOv5s 模型提出了一种扩展的 YOLOv5 多级分类目标检测算法模型.首先,对 LabelImg 标注工具进行功能扩展,使其满足多级分类标签文件构建;其次在 YOLOv5s 算法基础上修改检测头输出格式,在骨干网络前端引入 DenseBlock、Res2Net 网络模型核心设计思想,获取丰富的多维度特征信息,增强特征信息的

2、重用性,实现了 YOLO 多级分类目标检测任务.在开源安全帽数据集上同时以安全帽颜色作为二级分类进行训练验证,平均精度,精确率和召回率分别达到了95.81%、94.90%和 92.54%,实验结果验证了 YOLOv5 多级分类目标检测任务的可行性,并为目标检测及多级分类目标检测任务提供一种新的思路和方法.关键词:目标检测;YOLOv5;多级分类;DenseBlock 模块;损失函数;深度学习引用格式:金源,张长鲁.扩展 YOLOv5 安全帽多级目标分类检测.计算机系统应用,2023,32(2):139149.http:/www.c-s- YOLOv5 for Multi-level Targe

3、t Classification Detection of HelmetJINYuan1,ZHANGChang-Lu21(ComputerSchool,BeijingInformationScienceandTechnologyUniversity,Beijing100101,China)2(SchoolofEconomicsandManagement,BeijingInformationScienceandTechnologyUniversity,Beijing100192,China)Abstract:YOLOisoneofthemostimportantalgorithmmodelsin

4、thetargetdetectionofcomputervision.GiventheexistingYOLOv5smodel,anextendedYOLOv5algorithmmodelformulti-levelclassificationtargetdetectionisproposed.Firstly,thefunctionoftheannotationtoolLabelImgisextendedtoconstructmulti-levelclassificationlabelfiles.Secondly,theoutputformatofthedetectionheadismodif

5、iedonthisbasisoftheYOLOv5salgorithm,andthecoredesignideaoftheDenseBlockandRes2Netnetworkmodelisintroducedinthefrontendofthebackbonenetworktoextractrichmul-ti-dimensionalfeatureinformation,enhancethereusabilityoffeatureinformation,andrealizethetaskofYOLO-basedmulti-levelclassificationtargetdetection.

6、Thehelmetcoloristakenasthesecondaryclassificationfortrainingandverificationontheopensourcehelmetdataset,andtheaverageprecision,precision,andrecallreach95.81%,94.90%,and92.54%,respectively.TheexperimentalresultsverifythefeasibilityoftheYOLOv5-basedmulti-levelclassificationtargetdetectiontask,andthepr

7、oposedmodelprovidesanewideaandmethodfortargetdetectionandmulti-levelclassificationtargetdetectiontasks.Key words:targetdetection;YOLOv5;multi-levelclassification;DenseBlockmodule;lossfunction;deeplearning计算机系统应用ISSN1003-3254,CODENCSAOBNE-mail:ComputerSystems&Applications,2023,32(2):139149doi:10.1588

8、8/ki.csa.008946http:/www.c-s-中国科学院软件研究所版权所有.Tel:+86-10-62661041基金项目:国家重点研发计划(2018YFB1003705)收稿时间:2022-07-11;修改时间:2022-08-09;采用时间:2022-08-18;csa 在线出版时间:2022-11-04CNKI 网络首发时间:2022-11-18SoftwareTechniqueAlgorithm软件技术算法139安全帽是一种简单且有效的安全防护设备,可以有效减缓高空坠物的冲击,减少头部伤害,降低安全事故的伤亡率,从而被广泛用于各类施工现场,它不仅可以保障复杂施工环境下工人的

9、安全,同时安全帽具有显著颜色的特点,能够有预警的作用.近年来,摄像头在各类施工环境中的广泛使用,结合深度学习目标检测技术为复杂施工环境下安全管理提供了新的解决方案1,2.通过实时分析现场视频数据,可有效提高各类施工现场的安全性,同时减少人工成本.而目前主流算法对安全帽的研究主要检测是否佩戴安全帽分类任务,而同时以安全帽颜色作为二级分类的目标检测任务仍有比较大的研究空间.安全帽佩戴检测同时安全帽颜色分类识别更有利于施工现场的科学,精准,高效的安全管理3,进一步提高我国在复杂施工环境下的科学管理.目标检测是计算机视觉领域一个比较热门的研究方向,特别是深度卷积神经网络的快速发展极大地提升了目标检测的

10、精度4.自 2012 年的 AlexNet5被提出以来,基于卷积神经网络的计算机视觉技术得到了充分且广泛的发展.得益于卷积神经网络强大的语义特征表示能力,深度卷积神经网络模型在图像分类、目标检测6、实例分割7等相关领域都取得了比较优秀的成绩,在部分应用场景甚至超过了人类的水平.基于深度神经网络的目标检测是计算机视觉技术研究的一个热门领域,也是其他检测领域的一个基础性核心算法,能够为图像和视频的语义理解提供有价值的信息,其主要任务是对目标进行定位和分类,并准确高效地找出图像中所有感兴趣的目标信息,包括目标位置、目标分类.目标检测是图像理解和其他视觉研究任务的基础,为图像实例分割、图像理解、视频追

11、踪,视频场景分析等任务提供了强有力的特征分类基础信息.由于深度学习的广泛应用,以及人工神经网络模型的不断更新,目标检测算法也得到了快速的发展,检测准确度和效率也有很大的提升.深度人工神经网络目标检测算法主要分为以 R-CNN(regionCNN)系列为代表的双阶段目标检测算法和以YOLO(youonlylookonce)系列为代表的单阶段目标检测算法.二者的主要区别在于:单阶段目标检测算法基于回归方法直接在特征图上生成目标候选区域,而双阶段检测算法需要通过单独的区域建设网络生成目标候选区域.2014 年提出的 R-CNN8区域神经网络算法,是运用深度学习人工神经网络进行目标检测的开山之作,以

12、R-CNN 为基础,学者们对相关算法开展了深入研究,陆续涌现出了多个代表性双阶段目标检测算法.但双阶段算法还存算法效率低等不足,针对这些问题,2016 年出现了一种单阶段目标检测算法 YOLO9,其以实时性为典型特征的目标检测开始进入相关学者和研究人员的视野.以 YOLO 为基础,后续陆续提出了 YOLOv2,YOLOv310,YOLOv411,以及最新的YOLOv512,YOLOX13等算法.目前比较新的研究成果一般多以小目标检测14,15,密集目标,多尺度目标检测16,17为研究方向.但不论是双阶段算法模型还是单阶段算法模型,在多级分类目标检测方面仍有较大的研究空间.其中,以安全帽检测及安

13、全帽颜色分类的识别在实际工程应用中有非常重要的作用,可有效对施工现场人员的检测及精准识别相关人员,而 YOLOv5是 YOLO 系列网络模型较新的算法,其中骨干网络高度模块化,方便基础网络模块的修改和替换,便于本文研究的二级分类目标检测进行功能扩展.基于此,本文以 YOLOv5s 算法模型为基础,在安全帽数据集上同时以安全帽颜色作为二级分类,以多级分类目标检测为研究方向,逐步进行相关改进研究.首先对 LabelImg 标注工具进行功能完善,在原有功能的基础上添加多级分类标签,最后生成包含有多级分类标签的 YOLO 格式标签文件;其次将 DenseBlock18,19或 Res2Net20,21

14、网络模块引入到图像基础特征信息提取阶段的骨干网络前端,尽可能保留图像基础语义信息和多维度图像特征信息,以便更好地学习多级目标分类特征;最后改进马赛克图像增强算法,尽可能保留图像中的目标区域,同时还增加了小目标标签数量.这样不仅完善了网络模型在多级分类目标检测算法的功能,而且增强了模型在小目标检测应用背景下的检测性能.1YOLOv5 算法典型结构YOLOv5 算法整体主要有 3 部分组成:Backbone、Neck 和 Prediction,以 YOLOv5s 模型为例整体算法结构如图 1 所示.Backbone 主要有 Conv,C3 和 SPPF 基本网络模块组成,其主要功能就是提取图像特征

15、信息,C3 模块使用残差网络结构,可以学习到更多的特征信息,SPPF 模块是空间金字塔池化,也是 Backbone 网络的输出端,主要功能是将提取到的任意大小的特征信息转换成固定大小的特征向量.Neck 网络采用 FPN+PAN 的特征金字塔结构网络,可以实现不同尺寸目标特征信息的传递,可以有效解决多尺度问题.Prediction计算机系统应用http:/www.c-s-2023年第32卷第2期140软件技术算法SoftwareTechniqueAlgorithm采用 3 种损失函数分别计算目标分类损失,目标定位损失和置信度损失,并通过 NMS 提高网络检测的准确度.模型默认输入图

16、像尺寸大小为 640640 的 3 通道图像,最终输出格式是 3(5+ncls),ncls表示目标检测分类数量.Conv2dBNSiLUk1,s1,p0,c32Conv2dBNSiLUk1,s1,p0,c64Conv2dBNSiLUk1,s1,p0,c128Conv2dBNSiLUk1,s1,p0,c256MaxPool2dk5,s1,p2MaxPool2dk5,s1,p2MaxPool2dk5,s1,p2Conv2dBNSiLUk6,s2,p2,c32Conv2dBNSiLUk1,s1,p0,cBottleNeck 1Backbone模型改进PredictionPredictionNeck模型改进模型改进BottleNeck 2Conv2dBNSiLUk3,s1,p1,cConv2dBNSiLUk1,s1,p0,cConv2dBNSiLUk3,s1,p1,cConv2dBNSiLUk1,s1,p0,c16Conv2dBNSiLUk1,s1,p0,c16C3DRmnC3D2CMConv2dBNSiLUk1,s1,p0,c64Conv2dBNSiLUk3,s1,p0,c32Conv2dB

展开阅读全文

扩展YOLOv5安全帽多级目标分类检测_金源.pdf