单级感受野增强的红外多尺度目标检测网络

资源描述

1、引用格式：郑璐，周彤彤，叶泽聪，等单级感受野增强的红外多尺度目标检测网络电光与控制，（）：，（）：单级感受野增强的红外多尺度目标检测网络郑璐，周彤彤，叶泽聪，彭月平（武警工程大学，研究生大队；信息工程学院，西安）摘要：针对红外多尺度目标检测，提出了一种轻量级的基于单级感受野增强的检测网络。检测网络采用简化的作为骨干网络，结合空洞卷积和空间注意力机制，设计了单级感受野增强模块，使单级特征图感受野范围得到扩大，相邻像素点间的相关性得到增强。为提高模型反向传播效率、均衡正负样本，采用自适应训练样本选择方法，最终得到模型大小仅，浮点运算量仅的轻量级检测算法。在构建的数据集上达到，在显卡

2、上达到帧。关键词：目标检测；多尺度；单级感受野增强；轻量级算法中图分类号：文献标志码：，（，；，）：，：；引言目前，随着计算机硬件的发展以及红外数据集的扩充，越来越多的基于深度学习的红外目标检测算法问世。与基于手工固定滑动窗口、步长和固定超参数的传统检测方法相比，基于深度卷积神经网络的方法凭借强大的特征提取和学习能力，能够从复杂图像中提取特征并进行分层表示。这些特性使得设计基于深度卷积神经网络的目标检测算法成为当前复杂背景下红外目标检测的有效突破口。收稿日期：修回日期：基金项目：军队装备综合研究项目（）；科研单位自主选题研究项目（）作者简介：郑璐（），女，浙江金华人，硕士生。随着深度学习

3、技术的兴起，基于的红外目标检测方法通过数据驱动的方式学习目标特征，引起了广泛关注。文献率先将基于深度学习的目标检测算法应用于红外目标检测，但由于图像尺寸小、只有灰度信息、特征不明显，机器视觉领域现有的基于深度学习的目标检测算法不用于检测存在大量小目标的红外场景。为解决小目标虚警率高的问题，文献通过对高、低分辨率层的调整，重新设计了网络结构；文献采用自适应感受野融合模块，增加小目标周围的上下文信息，并引入空间注意力机制来优化网络；文献指出，有效的小锚点和浅层特征是小目标检测的关键；为解决红外目标淹没在背景杂波中时虚警率高、检测率低的问题，文献利用卷积神经网络巧妙地将检测问题转化为模式分类问题

4、，提出了一种第卷第期年月电光与控制郑璐等：单级感受野增强的红外多尺度目标检测网络天空复杂云背景下红外小目标检测算法；文献利用回归型的深度卷积神经网络进行背景成分抑制，通过阈值分割提取出候选目标区域；在轻量化网络设计方面，文献尝试平衡无人机检测的精度和速度，设计了基于深度卷积神经网络的红外无人机监控快速探测器；文献以目标中心点作为目标检测关键点，采用轻量化的特征提取网络，提出了一种基于关键点的快速红外目标检测方法。本文从降低模型复杂度、强化红外特征、提高多尺度目标检测性能个角度出发，提出一种基于单级感受野增强的红外多尺度目标检测网络。在特征提取阶段，采用简化的网络，

5、仅提取倍下采样特征图；在特征融合阶段，利用单级感受野增强模块扩大特征图感受野覆盖范围，同时强化不同区域间的相关性；在检测阶段，采用自适应样本选择的方法。在制作的数据集上进行实验，实验结果表明，该红外多尺度目标检测网络具有较好的检测效果。单级感受野增强的红外多尺度目标检测网络简化的骨干网络为尽可能地减少模型运算量，提高算法检测速度，改善特征提取网络带来大量参数的问题，节省计算资源，本文使用骨干网络进行优化。是等于年在的基础上提出的改进版本，是目前轻量级神经网络中最具代表性的网络之一，其主要思想是采用深度可分离卷积来减少运算量及参数量。的核心模块是具有线性激活的倒残差结构。普通的

6、残差结构先通过卷积进行降维，减少通道数，再用卷积核进行卷积处理，最后通过卷积扩充通道数实现升维。对于倒残差结构，首先在深度卷积之前使用卷积和激活函数，对通道数进行扩张，使网络能够获得更多特征，并在卷积进行通道降维后，用激活函数代替非线性的激活函数，防止滤除有用信息对特征造成破坏。在中通常采用，倍下采样特征图对多尺度目标进行检测，而本文算法中仅选取单级特征图作为后续感受野增强模块的输入，采用浅层特征图能够保留更多的细节信息。因此，使用作为骨干网络，选用倍下采样特征可以更充分地保留目标位置信息，保证了小目标的检测能力。单级感受野增强模块设计设计思路考虑到多层特征的融合网络

7、不可避免地会使检测器变得复杂，带来内存负担，并降低检测器的速度，考虑能否用单级特征图完成多尺度目标检测任务。文献指出特征金字塔（）的一大优势在于能够依据目标的不同尺度在不同级别的特征图上检测目标，对于单个特征图而言，特征感受野匹配的尺度范围限制了算法对检测目标的尺度，因此考虑能否找到一种使单级特征图感受野得到增强的优化方法，同时保证算法模型的简单、准确和快速。设计原理在红外多尺度目标图像中，由于目标尺度变化范围大，采用不同感受野的多级特征图对不同尺度目标进行检测。单一特征图的固定感受野只能匹配一定范围内的部分目标，当目标尺度和感受野不匹配时，检测效果会很差。受文献的启发，空洞卷积可以在不丢失分

8、辨率的情况下扩大感受野，让每个卷积输出都包含较大范围的信息。但由于空洞卷积的稀疏性，远距离卷积得到的信息之间通常没有相关性，容易造成局部信息丢失，对中小目标的检测很不友好。将感受野扩张前后特征图各通道上的像素分别进行相加，能够更好地克服这一问题。以空洞率为的空洞卷积为例，图（）、图（）分别表示有、无扩张感受野融合的感受野示意图。图感受野示意图由图可见，扩张感受野融合后的特征具备原输入的像素信息和更大范围内的感受野信息，相邻像素点间的相关性得到增强，有效缓解了空洞卷积棋盘效应造成的局部信息丢失。单级感受野增强模块基于上述设计思路和原理，设计的单级感受野增强模块主要由扩张感受野融合和自

9、适应滤波两个部分组成，如图所示。图感受野增强模块第期首先，在扩张感受野融合阶段，把特征提取网络的输出特征输入到卷积经过维度变换，经过空洞卷积扩大感受野，再经过卷积恢复输入维度得到特征。特征通过膨胀卷积，覆盖尺度范围得到一定程度的扩大，相当于原来覆盖的尺度乘上一个大于的因子，发生了偏移和扩大，仍然不能覆盖所有的目标尺度。所以对和各通道上像素值进行相加，使原始尺度范围和放大的尺度范围通过添加相应的特征相结合，得到一个包含多个接收域的输出特征，覆盖所有的目标尺度。随后，进入自适应滤波阶段，经过一个通道数为的卷积，将的三维特征压缩为的平面，再用函数激活，将其像素值调整

10、到范围内。此时可以看作一个既包含扩张感受野信息，又整合了各个通道间信息的强大滤波器，将输入特征通过滤波器，得到基于感受野增强的输出特征。基于单级感受野增强的红外多尺度目标检测网络设计在完成轻量级骨干网优化以及单级感受野增强模块设计的基础上，提出基于单级感受野增强的红外多尺度目标检测算法，用于红外多尺度无人机目标的检测，其网络结构如图所示。图红外多尺度目标检测网络结构图算法以优化的网络进行特征提取，仅使用原来的前层，即个和前组。数据集中输入图片大小为，特征提取阶段输出为的倍下采样特征图。在进入单级感受野增强模块之前先通过卷积完成上下文语义信息的细化。然后串联个扩

11、张率分别为，的感受野增强模块，赋予特征图不同大小的感受野，从而增加了特征感受野匹配的尺度范围，使网络能够捕获多尺度上下文信息，具备多尺度目标检测的能力。在目标预测阶段，单级特征图上稀疏的生成策略造成正样本不均衡，导致训练中存在大量简单负样本产生的梯度回传，影响困难样本分类的准确性。在参考和正样本确定方法的基础上，采用一种自适应训练样本选择方法，如图所示。图样本选择方式示意图如图所示，通过计算先验框与标注框之间的，并与设定的阈值进行比较来确定正样本，如果大于设定的正样本阈值，则视为正样本；如果小于负样本阈值，则视为负样本，其余为忽略样本。将特征图位置映射回原图进行比对，即特征图中心

12、点落在标注框内视为正样本，否则为负样本。在的采样方式下，可能出现整个目标位于先验框内或者整个先验框包含于标注框的情况（即目标很大或很小），仍达不到阈值，导致把正样本误认为是负样本的情况，影响算法对小目标的检测性能。对于采样方式，当目标较大时，会出现多个中心点均落在标注框内的情况，使算法将这些区域均视为正样本，但事实上该区域只包含了目标的一小部分，导致在大目标的检测中的采样方式降低了正样本的质量。为使本文算法在不同尺度目标的检测上均有不错的表现，本文采用的自适应训练样本选择方法，结合了前面两种方法的优势：在筛选候选正样本时采用了中心点距离相近的原则，在最后确定正样本时参考了中基于候选框

13、和标注框的方案。首先计算先验框中心点与标注框中心点的距离，然后选取中心点距离目标中心点最近的个先验框为候选正样本，在确定阈值时，考虑候选正样本的均值可以反映其整体质量，候选正样本的方差可以反映当前特征层的选择是否合适，综合考虑均值和方差进行阈值设置。如图（）所示，对多尺度目标而言，自适应训练样本选择的方法依据中心点距离相近的原则筛选出候选正样本，缩小待选区域范围，在此基础上计算候选正样本的均值和方差，并对特征层的选择进行调整：当普遍较高时，设置高的阈值；当较低时，设置低的阈值，以保证网络在面对大目标和小目标的检测时，仍具备准确寻找到高质量第卷电光与控制郑璐等：单级

14、感受野增强的红外多尺度目标检测网络正样本的能力。实验结果分析数据集由于目前缺乏公开可用的相关空中红外多尺度目标数据集，本文实验在“”比赛提供的红外无人机视频数据集的基础上构建数据集，涵盖多种不同复杂场景。在提供的红外无人机数据集中筛选出符合要求的个红外视频段，使用以帧的速率将视频提取成帧，调整图像大小为，编写程序进行对应标签的提取，将标签格式由“”转化成“”，最终得到由张图片和个对应的标签文件组成的数据集。实验细节和评估指标本文实验模型训练测试使用硬件平台为，；软件使用系统，深度学习框架；目标检测算法框架使用商汤科技联合香港中文大学开发的基于的深度学习目标检测框架。

15、在检测实时性方面，本文实验采用模型参数量、浮点运算量和每秒处理帧数（）项指标评估模型的大小、复杂程度和检测速度。在检测精度方面，采用准确率（）、召回率（）、阈值为的平均精度（，）这项指标评判算法模型的检测性能，分别表示为（）（）（）（）式中：为正确检测的目标数；为被检错的目标数；为未被检出的目标数。为精度，是对应每个标签的平均精度。对于本实验中仅有一种标签的情况，与在数值上是相等的。检测结果与性能分析为评估提出的基于单级感受野增强的红外多尺度目标检测网络的性能，本节分别从定量和定性两个角度进行分析。定量分析表为红外多尺度目标检测网络在数据集上的检测结果，其中，和分别是一阶段和

16、两阶段目标检测的经典算法，并且设有专门的多尺度融合用于多尺度目标的检测。是系列算法的最新成果，是的优化算法。表数据集检测结果算法召回率（帧）每秒浮点运算次数模型参数量本文（）（注：表格中个参数用来存储。）由表可以看出，在数据集中，基于单级感受野增强的红外多尺度目标检测网络取得了的值，与相比，参数量减小到了，值和召回率分别提升了和个百分点。与相比，值提升了个百分点，召回率提升了个百分点，由于采用了轻量级骨干网络，删掉了倍、倍和倍下采样特征图，检测速度提升了帧，说明本文算法在检测精度和速度上均优于经典目标检测算法。与的优化算法相比，值提升了个百分点，召回率提升了个百分点，参数量和浮点运算量大幅下降。本文算法在感受野增强模块中经过多次逐像素相加、相乘，故与相比浮点运算量有所增加，但参数量不足的，且值和召回率分别提升个百分点和个百分点，说明基于单级感受野增强的红外多尺度目标检测网络在检测精度（值）和速度上超越了目前许多改进算法。定性分析图显示了，和本文算法在数据集上的可视化检测结果。可以看出，在第张图的检测中，框出的目标明显大于

展开阅读全文

单级感受野增强的红外多尺度目标检测网络_郑璐.pdf