改进型SSD道路行人目标检测算法

资源描述

1、国外电子测量技术北大中文核心期刊：改进型道路行人目标检测算法贾君霞史珂鑫（兰州交通大学电子与信息工程学院兰州）摘要：针对道路目标检测中行人目标检测效果不佳的问题，提出了一种改进型行人目标检测算法。首先，采用具有噪声的基于密度的聚类方法（）结合算法选取适当规格的，使用剔除样本干扰点后利用确定聚类中心，根据重叠度选择适当规格的；然后，对算法的各个特征图进行尺度不变的卷积操作构建语义信息增强的特征图，并将原始特征图与增强特征图按照方式特征融合，生成算法的改进特征金字塔网络；最后，充分考虑正负样本不均衡的情况，选择函数，并结合函数修正损失函数。实验结果表明，改进型算法可

2、以提高道路行人目标检测的精度和速度，并且在客观评价上取得了良好的效果。该算法在测试集上的行人目标检测平均精度为，检测速率为。关键词：目标检测；特征金字塔网络；聚类算法；函数中图分类号：文献标识码：国家标准学科分类代码：（，）：，；，：；收稿日期：基金项目：国家自然科学基金（）、甘肃省教育厅年青年博士基金项目（）、甘肃省重点研发计划（）、甘肃省科技厅年重点研发计划（）项目资助引言目标检测是为检测图像和视频中真实目标物体的位置和尺度而提出的，该技术是实例分割、目标跟踪和识别等计算机视觉任务的技术基石。同时，目标检测技术被广泛应用于智能驾驶、智能监控系统和军事目标检测等场景中。以往目标检测

3、算法大多基于手工特征，其检测步骤为输入图像获取候选框后提取特征信息，通过特征信息进行分类和识别。鉴于传统目标检测算法存在鲁棒性差、算北大中文核心期刊国外电子测量技术法难度较大的缺陷，导致其难应用于复杂场景。为满足复杂场景下的实时性需求，依托日益成熟的深度学习技术，学者们将深度学习技术与目标检测相结合，提出基于深度学习的目标检测算法。一种是生成候选区域后目标检测的两阶段目标检测算法，如、等，其检测精度高，但候选区域过多，检测速度较慢；另一种是单阶段目标检测算法，直接对网络模型提取的特征进行检测。算法是典型的单阶段目标检测算法之一。算法摒弃了候选区域生成的环节，将输入图像划分为网格，通过设置不同

4、长宽比的，获得目标位置和类别。其检测速度较快，但检测精度有所下降。等提出了算法，为单阶段多尺度特征融合的目标检测算法。该算法融合了算法的机制和算法的回归思想。算法性能较好，在提高检测精度的同时兼顾检测速度，成为深度学习目标检测算法的一个可能的发展方向和研究趋势。为进一步完善小目标检测效果，学者们提出了一系列基于的改进模型。年，等提出模型，通过使用反卷积层增加上下文信息；年，等提出模型，通过改进特征融合方式增强特征信息；年，等提出模型，该模型基于密度卷积和功能融合，对小目标和具有特定关系的目标具有先进的检测效果；年，李晖晖等提出基于和改进的模型，提升了小目标

5、检测精度；年，等提出模型，该模型基于特征融合和扩展卷积，有效提高了小目标多尺度信息的利用率。上述改进的模型主要是基于基础网络的改进和特征融合方式的改进提高检测效果。此时，网络结构复杂度增大，以牺牲检测速度为代价获取更高检测精度，仍无法实现实时检测。综上所述，道路目标检测场景中行人目标检测存在应用环境复杂、行人目标遮挡以及精度低，且需兼顾检测速度的问题。本文设计了一种基于改进算法的道路行人目标检测算法。采用具有噪声的基于密度的聚类方法（，）分析后并选用聚类算法分析以选择尺度适当的，进一步提高算法模型学习效率；提出了一种改进型特征检测模块，该模块可以有效

6、地实现特征增强与特征融合机制，更好地利用输入特征从而提高检测精度；选用函数修正原损失函数，优化正负样本不均衡的情况。原算法网络结构中，为特征提取模型。在此基础上，通过添加自定义卷积层，形成新的卷积模型，以获得局部特征信息而后进行目标检测。网络结构如图所示。图的网络结构网络检测的基本过程如下：将原始图片输入到基础网络中，并依次使用的、的、的、的、的、的这个辅助卷积层进行卷积操作，得到预测目标的特征信息，而后利用检测器预测目标位置及所属类别。最终使用非极大值抑制算法（，）得到最终检测结果。尺度如式（）所示，其位置公式如式（）所示，其对应边界框公式如式（）所示。

7、，（）（，）（）（，）（）式中：、为长、宽；、为中心坐标；为面积；为系数因素；为距离。中与真实目标的匹配原则为，对于而言，如果真实目标与的值相等或超过一定阈值，即为正样本，反之则为负样本。算法虽设置匹配原则，但密集采样造成正负样本严重不平衡。为保证检测效果，在选择训练的负样本时遵循难例挖掘的原则，即选取困难负样本。网络训练的损失函数为多任务损失函数，总损失函数是分类损失和定位损失的加权和：国外电子测量技术北大中文核心期刊（，）（，）（，）（）式中：为分类损失；为定位损失；为的正样本数量；为当前预测框的类别匹配信息；为类别置信度预测信息；为预测框信息；为检测框的真值。改进算

8、法的网络结构数据集聚类算法目标检测中算法不仅要学习目标类别，更需要学习到目标大小与位置。为使得目标检测任务的完成引入，合适尺度的会使得算法模型更容易学习；并且通过设置不同尺度的将提高目标物体与的匹配概率，从而提高提高道路行人目标的检测精度。为解决原算法的尺度无法满足道路场景中行人目标的检测问题，本文对尺度进行优化，利用聚类算法，在训练数据集中选择合适的尺度。首先，利用分析样本分布的紧密度，去除聚类结果中的噪音声与孤立点，生成新的样本并为新的样本分布赋值；然后，使用确定聚类中心，根据重叠度（，）选择合适的尺度。聚类过程中算法距离公式定义如下：（，）（，）（

9、）式中：为样本框大小；为聚类框大小；为聚类算法产生的聚类中心；为样本框大小和聚类框大小的交互比，作为两个框大小相似的度量。聚类算法的具体实现过程如下。步骤）在训练数据集中提取并存储图像尺寸与目标框信息（，）。步骤）获得目标框宽度与高度（宽度为和差值，高度为和差值）。步骤）自适应缩放训练数据集中图像的尺寸，并以相同比例缩放目标框尺寸，得到（，）。步骤）初始化聚类算法，在获得的（，）中随机选择个（，）作为聚类中心，这就是初始化的个。步骤）计算每个（，）与初始聚类中心之间的距离。根据距离分类，每个（，）归入距离最近的中。步骤）在步骤）中，所有（，）初步划分为类，此时使用聚类算法，重

10、新确定每个类中的聚类中心。步骤）重复步骤），直到计算出的距离不再变化。这时，聚类中心即为。本文数据集选取数据集中的类别，使用聚类方法聚类分析该类别的样本框。聚类算法分析后确定的值为，最终通过聚类算法对样本聚类分析后，选取对应先验框的长宽分别为（，）、（，）、（，）、（，）、（，）、（，）、（，）、（，）、（，）。改进特征图检测模块同一张图片中目标类别不一且目标比例信息与位置信息均不同，此种情况会给目标检测带来一定的难度。浅层卷积层预测小目标，但浅层卷积层特征结构比较简单且特征信息极易受到干扰；并且小目标信息会随着网络的加深，在高层卷积层中被丢掉，从而造成小目标检测效果不佳。因此，本

11、文采用一种改进的特征图检测模块。其框架如图所示。图改进网络结构首先使用的卷积核对、（简称）进行卷积操作，得到、（简称）个新特征层。由于的特征信息较丰富，且特征图尺寸较小，因此本文无需特征增强，仍保留原始特征信息。在特征融合模块中，采用轻量级特征融合，主要体现在特征层的尺寸与维数无需调整。融合策略为将原特征层、分别与新特征层、，进行特征融合，得到融合后的特征层、。选用融合后的特征层构建新的特征金字塔网络，之后在新的特征金字塔网络上完成对目标的分类和定位。特征融合策略图如图所示。函数的引入损失函数作为量化预测值与真实值差异的评判依据，其目的是使得模

12、型可以向真实值的方向预测，并且在很大程度上影响着网络模型的结果。函数公式北大中文核心期刊国外电子测量技术图特征融合结构如下：（）（）（）式中：为类别的预测概率，（）为调制因子，为调制参数。当很小时，（）趋近于，此时损失函数中样本权重不受影响；当很大时，（）趋近于，损失函数中样本权重明显下降。损失函数中分类置信度损失采用，其定义如下：（，）?（）?（）（）由式（）可知，正样本误差和负样本误差构成分类损失误差，存在正负样本不均衡的情况。为保证网络结构稳定性，本文通过引入损失函数替换损失函数修正损失函数，构建新的分类置信度损失函数如下：（）（）（）（）（）式中：为第个样本被预测为正样本或负样本

13、的概率，为可调至因子。当时，此时函数与函数等同；当增加时，（）也增加，通过平衡易分样本调低权值的比例。实验结果和分析基于改进型算法，本文通过选取数据集中类比较不同目标检测算法的检测精度和速率验证改进型算法的有效性。本文选用评价指标，平均精度（）和帧速。可较好反映该算法的查准率与查全率，更全面地衡量模型性能；帧率可直观反映模型检测速度。实验环境和参数设置数据集为自动驾驶的评估数据集，其图像取自真实场景，每张图像类别信息丰富，目标位置存在遮挡。本文实验训练和测试对象为数据集中类，共选取幅图像，幅图像构成训练数据集，幅图像构成测试数据集。实验基于平台，为，显卡为。编译环

14、境为，编程语言为。网络训练时对改进算法权重的初始化采用传统在数据集上训练得到的权重。其训练参数设置如表所示。表训练参数设置迭代计算批量大小初始学习率动量权重衰减系数随着迭代次数的增加，在次迭代中学习率降低为；在次迭代中学习率降低为，此时损失函数进一步收敛。实验验证和分析）优化前后比较分析表为数据集的类中算法优化前后的检测结果对比。从表可以看出，优化后，算法的平均精度提高了，检测速度达到了。表不同测试结果方法帧率优化后）特征图检测实验比较分析表为改进算法特征图检测前后对数据集类的检测结果比较。从表可以看出，经过特征图检测后，算法的检测精度提高了。

15、由于网络结构复杂性的增加，牺牲了一定的检测速度，但与原算法基本持平。可以证明，特征图检测的改进对检测速度的提高有一定的提升。表特征图改进前后检测结果方法帧率改进特征图后）损失函数实验比较分析为保证损失函数改进的有效性，本文对数据集类进行损失函数改进前后算法的对比实验。在保证尺度不变，只改进损失函数的条件下得到的检测结果如表所示。从表可以看出，与原相比，改进后的损失函数的检测精度提升至，检测速度提高至。此实验证明引入函数可以有效地提高行人小目标的检测精度与速度。国外电子测量技术北大中文核心期刊表不同损失函数测试结果方法帧率改进损失函数的实验结果）行人目标检测结果为

16、直观评估改进算法对小目标检测的效果，本文选取组道路图片分别与、改进型进行对比。对比算法检测结果如图所示。由图可知，与解决了部分行人目标问题，但检测精度不高且仍存在行人目标漏检问题。在基础上，通过优化尺度、改进特征金字塔网络结构以及修正损失函数后，可在图中直观感受到道路图像中行人目标的检测精度有所提高。为进一步验证改进算法的小目标检测效果，本图小目标检测结果实验基于检测精度（）、召回率（）以及三个评价指标验证改进的算法的有效性。检测精度计算公式如式（）所示，召回率计算公式如式（）所示，计算公式如式（）所示。（）（）（）式中：为正样本被标记为正样本的个数；为负样本被标记为正样本的个数；为负样本被标记为负样本的个数；正样本被标记为负样本的个数；为对检测准确率和召回率的调和平均。在数据集的类中和改进型在检测精度、召回率和的数据比较如表所示。由表可知，本文改进型的检测精度为，召回率为，为。与原相比，检测精度提高了，召回率提高了，提高了。改进型对提高道路行人小目标检测的准确性和速度具有显著效果。）与其他目标检测算法结果比较为进一步验证本文改进型算法提高

展开阅读全文

改进型SSD道路行人目标检测算法_贾君霞.pdf