收藏 分享(赏)

改进多尺度卷积结构与高斯核...E-CenterNet算法_胡松松.pdf

上传人:哎呦****中 文档编号:2370147 上传时间:2023-05-10 格式:PDF 页数:11 大小:2.14MB
下载 相关 举报
改进多尺度卷积结构与高斯核...E-CenterNet算法_胡松松.pdf_第1页
第1页 / 共11页
改进多尺度卷积结构与高斯核...E-CenterNet算法_胡松松.pdf_第2页
第2页 / 共11页
改进多尺度卷积结构与高斯核...E-CenterNet算法_胡松松.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、Computer Engineering and Applications计算机工程与应用2023,59(6)目标检测在智能导航、工业生产、水下探测、智慧交通等领域有着重要的作用。通俗来讲,目标检测就是从图像中找到需要检测的目标,除了需要找到目标所在的位置,还需要对目标的类别进行判别,通常包含两个主要步骤:(1)图像提取特征;(2)回归目标的位置和类别。在深度学习浪潮到来之前,传统算法在目标检测领域扮演着重要的角色,并涌现出了很多优秀的算法。Viola等1首次将Haar特征和级联结构结合在一起对人理论与研发改进多尺度卷积结构与高斯核的E-CenterNet算法胡松松,吴亮红,张红强,陈亮,周博

2、文,张侣湖南科技大学 信息与电气工程学院,湖南 湘潭 411201摘要:针对ResNet和DLA(deep layer aggregation)为主干网络的CenterNet算法特征提取能力不充分、热力图与目标真实边界框吻合度不高、关键点损失函数未充分考虑预测值对难易样本训练比重的影响等不足,提出一种改进多尺度卷积结构与高斯核的E-CenterNet算法。引入轻量型EfficientNetV2-S作为主干网络,并结合基于金字塔分割注意力网络的多尺度卷积结构对其进行改进,提高特征提取能力;对高斯核进行改进,使CenterNet产生的热力图由固定的圆形改进为随边界框宽高变化的椭圆形,增强算法对边界

3、框宽高差异大的目标的检测能力;提出一种基于关键点预测值的关键点损失函数,提高算法对难样本的训练比例。在Pascal VOC数据集上的实验结果表明:E-CenterNet算法的mAP达到83.3%,比原始算法提升了2.6个百分点,检测性能优于CenterNet算法。关键词:CenterNet;目标检测;多尺度卷积;高斯核;关键点损失函数文献标志码:A中图分类号:TP183doi:10.3778/j.issn.1002-8331.2205-0430E-CenterNet Algorithm with Improved Multi-Scale Convolution Structure and Ga

4、ussian KernelHU Songsong,WU Lianghong,ZHANG Hongqiang,CHEN Liang,ZHOU Bowen,ZHANG LyuSchool of Information and Electrical Engineering,Hunan University of Science and Technology,Xiangtan,Hunan 411201,ChinaAbstract:As the detection algorithm,the CenterNet based on ResNet and DLA(deep layer aggregation

5、)as the backbonedoesn t have sufficient capabilities for feature extractions,neither its heatmap accords with the target real bounding boxnor the keypoint loss function fully consider the impact of the predicted value on the training proportion of difficult andeasy samples.In order to solve these de

6、ficiencies,E-CenterNet with more advanced multi-scale convolution structure andGaussian kernel is proposed.Firstly,lightweight EfficientNetV2-S is introduced as the backbone,and the multi-scale con-volution structure based on the pyramid split attention network is used to enhance the feature extract

7、ion ability.Secondly,by improving the Gaussian kernel,the heatmap generated by CenterNet is enhanced from a fixed circle to an ellipse vary-ing with the width and height of the bounding box,which enhances the detection ability of algorithm for objects withlarge differences in the width and height of

8、 the bounding box.Finally,the Keypoint loss function based on the predictedvalue is proposed in order to augment the training ratio of the algorithm E-CenterNet for difficult samples.The experimentalresults on the Pascal VOC indicate that the mAP of the E-CenterNet accounts for 83.3%,which is 2.6 pe

9、rcentage pointshigher than that of the CenterNet,and the detection performance of E-CenterNet is better than that of the CenterNet.Key words:CenterNet;object detection;multi-scale convolution;Gaussian kernel;keypoint loss function基金项目:国家自然科学基金(61603132);国家部委基础科研计划(JCKY2019403D006);湖南省科技创新计划(2017XK23

10、02);湖南省自然科学基金(2021JJ30280);湖南省科协科技人才托举工程(2022TJ-Q03);湖南省教育厅优秀青年项目(19B200)。作者简介:胡松松(1997),男,硕士研究生,CCF会员,主要研究方向为图像处理、目标检测,E-mail:;吴亮红(1977),男,博士,教授,博士生导师,主要研究方向为智能计算、进化计算、计算机视觉及应用;张红强(1979),男,博士,讲师,主要研究方向为群机器人系统、群体智能、优化与智能控制。收稿日期:2022-05-20修回日期:2022-09-13文章编号:1002-8331(2023)06-0070-11702023,59(6)脸进行特征

11、提取和实时检测,解决了滑动窗口检测带来的低效问题。Dalal等2提出梯度直方图特征,并将其和线性SVM分类器结合起来用于行人检测,达到了较高的检测精度。Felzenszwalb等3对梯度直方图特征进行改进,针对检测目标的多视角和形变问题,对图像构建尺度金字塔并在各个尺度搜索目标,获得较快运算速度的同时提升了对不同形态物体检测的鲁棒性。Lowe4利用SIFT算法来查找特征点匹配目标,提升了对遮挡目标的识别率;Bay等5在SIFT算法的基础上提出SURF算法,利用近似的Hessian矩阵减少降采样过程,提升了检测速度。以上传统算法都是基于人工的方式对图像选取特征,运算量小,对于如行人、人脸之类简单

12、目标的检测准确率较高,鲁棒性较好。但是,随着时间的推移,检测目标变得多样,目标背景变得更复杂丰富,传统的目标检测算法已不能满足实际检测的需要。针对传统检测算法不能满足现阶段需要这一问题,基于深度学习的特征提取、训练方法逐渐成为主流方法,依据检测方式可分为两类:单阶段算法(one stage)和双阶段算法(two stage)。单阶段检测算法即基于回归的检测算法,不经过产生候选区域(region proposals)的过程,而是直接对输入的图像提取特征,回归出目标的类别和对应的位置等信息,其代表算法主要有YOLO系列6-9、SSD系列10-12、CornerNet13、Extreme-Net14

13、、RefineDet15和 CenterNet16-18算法等。由于单阶段检测算法不用确定候选区域,不需要大量中间的步骤,故检测速度快、实时性强。双阶段检测算法即基于候选区域的检测算法,首先从输入的图像中穷举出可能包含目标的候选区域,随后对候选区域进行处理,回归出目标的类别和位置信息,其代表算法有R-CNN19、SPP-Net20、Fast R-CNN21、Faster R-CNN22、R-FCN23等。由于两阶段检测算法具有候选区域操作,相比于一阶段检测算法精度更高,但实时性较低。为了改进单阶段检测算法CenterNet存在的不足,提高模型的检测效果,本文提出一种改进多尺度卷积结构与高斯核的

14、目标检测算法,称为 E-CenterNet。为了提升主干网络的特征提取能力,引入新的主干网络EfficientNetV2-S,并结合基于金字塔分割注意力网络的多尺度卷积结构进行改进,提高主干网络多尺度特征的表达能力,从而更有利于提取目标的特征。同时,对高斯核进行改进,使CenterNet产生的热力图由圆形改进为更契合边界框的椭圆形,提高算法对边界框宽高差别大的目标的检测能力,减少冗余的计算量。在以上基础上,进一步对关键点损失函数Lk进行改进,提出基于预测值Y?xyc线性调节量级的关键点损失函数Lk1,以提高模型对难分样本训练的专注度。实验结果表明,E-CenterNet能有效提高算法的平均精度

15、均值,提升模型性能。1CenterNet网络CenterNet 是一种基于 Anchor-free 的目标检测算法16-18,在CornerNet13算法的基础上改进而来。该算法的思想在于创建模型时将目标视为一个关键点,即目标边界框的中心点。算法通过对目标关键点进行估计来找到中心点,并对目标的其他属性进行回归预测,如尺寸、3D位置、方向、姿态信息等。相比于其他双阶段目标检测算法,CenterNet 去除了低效复杂的 Anchors 操作,提升了检测算法性能,同时算法直接在热力图上执行过滤操作,去除了耗时的NMS后处理操作,进一步提升了整个算法的运行速度。CenterNet算法分别采用了Resn

16、et24、Hourglass25、DLA26作为主干网络,三种主干网络结构均由特征提取层、反卷积层和输出层组成。同时,主干网络的输出层包含了三种CenterNet的头部结构,分别为关键点预测、关键点偏移预测和物体宽高预测,如图1所示。假设CenterNet算法的输入图像表示为IRWH3,W、H分别表示图像的宽和高。图像经过算法计算后,会生成一个由关键点构成的热力图,如式(1)所示:Y?0,1WRHRC(1)式中,R表示下采样因子,C为要预测的类别数,本文中R取4,C取20。对于一个类别c产生的热力图,当Y?x,y,c=1时,表示当前(x,y)位置处为关键点,即存在该类别,反之当Y?x,y,c=0,表示该位置没有这个类别,属于背景。在训练阶段,对于类别ck,假设其中一个目标k的边界框在图像中的坐标为()x(k)1,y(k)1,x(k)2,y(k)2,则中心点HeatmapsOffsetsSize(WH)Hourglass Networkor ResNet,or DLA图1CenterNet网络结构Fig.1Network structure of CenterNet胡松松,等:改进多尺度

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 专业资料 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2