基于改进YOLOv5的复杂场景多目标检测

资源描述

1、电子测量技术E L E C T RON I CME A S U R EME N TT E CHNO L O G Y第4 5卷第2 3期2 0 2 2年1 2月 D O I:1 0.1 9 6 5 1/j.c n k i.e m t.2 2 1 0 0 3 5基于改进Y O L O v 5的复杂场景多目标检测*强栋王占刚(北京信息科技大学信息与通信工程学院北京 1 0 0 1 0 1)摘要:针对多目标图像检测环境复杂、目标物位置数据冗余且长宽高数据大小不一的问题,利用神经网络算法可以有效提高不同类目标物并行检测的准确度和稳定性,提出一种基于改进YO L O v 5网络的多目

2、标检测方法。首先依据不同目标物的空间尺度大小,改进模型的特征融合方法,添加多尺度特征检测层以减小多目标检测时的误差,同时增加自适应特征增强模块(a d a p t i v e f e a t u r e a d j u s t m e n t),降低网络的误检率与漏检率;然后使用 K-m e a n s+算法估计候选框,获得更优的框参数;最后在损失函数中使用E I OU(e f f i c i e n t I OU l o s s)做优化。实验表明:改进后的方法mA P(m e a n a v e r a g e p r e c i s i o n)达到7 6.4 8%,相比经典YO L O

3、v 5网络提升了3.2%,小尺寸目标物检测准确度均值增加6.3%。改进方法网络延续YO L O v 5网络的轻量高效,对于多尺度目标物检测获得更优的检测精度,能够实现更准确的实时多目标检测。关键词:神经网络;多目标检测;YO L O v 5;自适应特征增强;损失函数优化中图分类号:T P 3 9 1.4 文献标识码:A 国家标准学科分类代码:5 1 0.4 0 5 0I m p r o v e d Y O L O v 5 c o m p l e x s c e n e m u l t i-t a r g e t d e t e c t i o nQ i a n g D o n g W a n

4、g Z h a n g a n g(S c h o o l o f I n f o r m a t i o n a n d C o mm u n i c a t i o n E n g i n e e r i n g,B e i j i n g I n f o r m a t i o n S c i e n c e a n d T e c h n o l o g y U n i v e r s i t y,B e i j i n g 1 0 0 1 0 1,C h i n a)A b s t r a c t:A i m i n g a t t h e p r o b l e m s o f c

5、 o m p l e x m u l t i-t a r g e t i m a g e d e t e c t i o n s c e n e s a n d r e d u n d a n t t a r g e t p o s i t i o n d a t a w i t h d i f f e r e n t l e n g t h,w i d t h a n d h e i g h t,t h e n e u r a l n e t w o r k a l g o r i t h m c a n e f f e c t i v e l y i m p r o v e t h e a

6、 c c u r a c y a n d s t a b i l i t y o f p a r a l l e l d e t e c t i o n o f d i f f e r e n t t y p e s o f t a r g e t s.A m u l t i-t a r g e t d e t e c t i o n m e t h o d b a s e d o n t h e i m p r o v e d YO L O v 5 n e t w o r k i s p r o p o s e d.F i r s t,a c c o r d i n g t o t h e

7、s p a t i a l s c a l e o f d i f f e r e n t o b j e c t s,t h e f e a t u r e f u s i o n m e t h o d o f t h e m o d e l i s i m p r o v e d,a n d a m u l t i-s c a l e f e a t u r e d e t e c t i o n l a y e r i s a d d e d t o r e d u c e t h e e r r o r o f m u l t i-t a r g e t d e t e c t i

8、o n.A t t h e s a m e t i m e,A d a p t i v e F e a t u r e A d j u s t m e n t m o d u l e i s a d d e d t o r e d u c e t h e f a l s e d e t e c t i o n r a t e a n d m i s s e d d e t e c t i o n r a t e o f t h e n e t w o r k;t h e n K-m e a n s+a l g o r i t h m i s u s e d t o e s t i m a t

9、e t h e c a n d i d a t e f r a m e t o o b t a i n b e t t e r f r a m e p a r a m e t e r s;f i n a l l y,E f f i c i e n t I OU L o s s i s u s e d i n t h e l o s s f u n c t i o n f o r o p t i m i z a t i o n.E x p e r i m e n t s s h o w t h a t t h e m e a n a v e r a g e p r e c i s i o n o

10、 f t h e i m p r o v e d m e t h o d r e a c h e s 7 6.4 8%,w h i c h i s 3.2%h i g h e r t h a n t h e c l a s s i c YO L O v 5 n e t w o r k,a n d t h e a v e r a g e d e t e c t i o n a c c u r a c y o f s m a l l-s i z e d o b j e c t s i n c r e a s e s b y 6.3%.T h e i m p r o v e d m e t h o

11、d n e t w o r k c o n t i n u e s t h e l i g h t w e i g h t a n d h i g h-e f f i c i e n c y o f t h e YO L O v 5 n e t w o r k,o b t a i n s b e t t e r d e t e c t i o n a c c u r a c y f o r m u l t i-s c a l e t a r g e t d e t e c t i o n a n d c a n a c h i e v e m o r e a c c u r a t e r e

12、 a l-t i m e m u l t i-t a r g e t d e t e c t i o n.K e y w o r d s:n e u r a l n e t w o r k;m u l t i-t a r g e t d e t e c t i o n;YO L O v 5;a d a p t i v e f e a t u r e e n h a n c e m e n t;l o s s f u n c t i o n o p t i m i z a t i o n 收稿日期:2 0 2 2-0 5-2 0*基金项目:国家重点研发计划课题(2 0 1 8 Y F C 1 8

13、 0 0 2 0 3)、北京市科技创新服务能力建设-基本科研业务费(市级)(科研类)(P XM 2 0 1 9_0 1 4 2 2 4_0 0 0 0 2 6)项目资助0 引言在计算机视觉和深度学习技术蓬勃发展的今天,作为图像识别和增强现实领域核心技术之一的多尺度目标检测算法也在不断发展,伴随着各个行业与计算机及人工智能联合愈发紧密,多目标检测技术在人脸识别、海关安检、消防预警、公安监控、车辆检测,医学仪器检查以及军事等领域取得了广泛的应用。目标检测主要是通过对特定图像进行处理,利用相关算法提取图像的特征指标,从而获得指定目标物在图像中的位置、长宽高范围并且识别此目标物1。相较于传统算法,

14、深度学习在目标检测中的应用使得检测效率和速率有极大的提升,利用该技术在输入图像和视频28 强栋等:基于改进YO L O v 5的复杂场景多目标检测第2 3期中可以锁定目标物的精确位置,获得高精度目标参数并且识别该目标物的类别2。多目标检测往往是提升目标检测效果的有效方法和必要步骤3,但由于多目标图像检测同时包含多个特征尺度不一的目标物,位置数据准确性不高,多种目标物特征信息复杂,识别判定困难,所以需要引入性能更强和效率更高的深度学习算法4。有别于单一目标检测,多目标检测算法利用卷积神经网络算法提取目标物复杂多样的图像特征信息,其特征特异性减弱,可同时适用于多种目标物的识别,提高了检测算法

15、的有效性和稳定性5。基于一个单独e n d t o e n d回归卷积神经网络的Y O L O目标检测算法6于2 0 1 5年提出后发展迅速。相较于R-C N N和F a s t e r C N N算法,Y O L O深度学习的训练和检测均是在一个单独的卷积网络中进行,其算法不事先标定目标检测预选区域(r e g i o n p r o p o s a l),而是直接将输入图像在Y O L O网络层中进行训练和检测,最终输出由2 4个卷积层和2个全连接层处理后的图像特征信息。随着Y O L O算法的发展迭代,又更新了m A P值更高的v 2、v 3、v 4、v 5版本的改进算法7。YO L O

16、目标检测算法采用设计简洁的模型,检测效率比较高,不过对于更新迭代后的 YO L O v 5 算法,其将全局特征图中的多个特征信息采用类似的权重进行计算,使得多个特征信息对模型结果产生类似的影响。但是,在现实场景下,目标附近通常伴随着相互关联密切的上下文语义,模型需将关注点集中于关键语义且省略关联不大的背景语义,不应该同等对待8;其次由于现实环境多目标检测场景中存在数目较大的多尺度目标物,单一目标物信息匮乏,且多尺度目标在不同角度现实场景中呈现的位置信息差异较大,目标物空间尺度不一,从而使得检测精度不高9;另外,采用拍摄设备采集现实环境多目标复杂场景的图像,位置集中的多目标间彼此易发生空间重叠情况。综上所述,应提出一种适用于复杂现实场景下的多尺度目标物检测模型,以满足实际应用场景需求。针对多目标图像检测环境复杂、目标物位置数据冗余且长宽高数据大小不一、目标物识别判定信息繁多的特点,本文在YO L O v 5算法的基础上加以创新。首先,为了提升空间尺度较小的目标物的检测精度,结合空间注意力与通道注意力,引入自适应特征增强模块(A d a p t i v e F e a t u r e A

展开阅读全文

基于改进YOLOv5的复杂场景多目标检测_强栋.pdf