1、国外电子测量技术北大中文核心期刊 :改进型 道路行人目标检测算法贾君霞史珂鑫(兰州交通大学电子与信息工程学院 兰州 )摘要:针对道路目标检测中行人目标检测效果不佳的问题,提出了一种改进型 行人目标检测算法。首先,采用具有噪声的基于密度的聚类方法()结合 算法选取适当规格的 ,使用 剔除样本干扰点后利用 确定聚类中心,根据重叠度选择适当规格的 ;然后,对 算法的各个特征图进行尺度不变的卷积操作构建语义信息增强的特征图,并将原始特征图与增强特征图按照 方式特征融合,生成 算法的改进特征金字塔网络;最后,充分考虑正负样本不均衡的情况,选择 函数,并结合 函数修正损失函数。实验结果表明,改进型 算法可
2、以提高道路行人目标检测的精度和速度,并且在客观评价上取得了良好的效果。该算法在 测试集上的行人目标检测平均精度为 ,检测速率为 。关键词:目标检测;特征金字塔网络;聚类算法;函数中图分类号:文献标识码:国家标准学科分类代码:(,):,;,:;收稿日期:基金项目:国家自然科学基金()、甘肃省教育厅 年青年博士基金项目()、甘肃省重点研发计划()、甘肃省科技厅 年重点研发计划()项目资助引言目标检测是为检测图像和视频中真实目标物体的位置和尺度而提出的,该技术是实例分割、目标跟踪和识别等计算机视觉任务的技术基石。同时,目标检测技术被广泛应用于智能驾驶、智能监控系统和军事目标检测等场景中。以往目标检测
3、算法大多基于手工特征,其检测步骤为输入图像获取候选框后提取特征信息,通过特征信息进行分类和识别。鉴于传统目标检测算法存在鲁棒性差、算北大中文核心期刊国外电子测量技术法难度较大的缺陷,导致其难应用于复杂场景。为满足复杂场景下的实时性需求,依托日益成熟的深度学习技术,学者们将深度学习技术与目标检测相结合,提出基于深度学习的目标检测算法。一种是生成候选区域后目标检测的两阶段目标检测算法,如 、等,其检测精度高,但候选区域过多,检测速度较慢;另一种是单阶段目标检测算法,直接对网络模型提取的特征进行检测。算法是典型的单阶段目标检测算法之一。算法摒弃了候选区域生成的环节,将输入图像划分为网格,通过设置不同
4、长宽比的 ,获得目标位置和类别。其检测速度较快,但检测精度有所下降。等提出了 算法,为单阶段多尺度特征融合的目标检测算法。该算法融合了 算法的 机制和 算法的回归思想。算法性能较好,在提高检测精度的同时兼顾检测速度,成为深度学习目标检测算法的一个可能的发展方向和研究趋势。为进一步完善小目标检测效果,学者们提出了一系列基于 的改进模型。年,等提出 模型,通过使用反卷积层增加上下文信息;年,等 提出 模型,通过改进特征融合方式增强特征信息;年,等 提出 模型,该模型基于密度卷积和功能融合,对小目标和具有特定关系的目标具有先进的检测效果;年,李晖晖等 提出基于 和 改进的 模 型,提 升了 小目 标
5、 检测 精度;年,等 提出 模型,该模型基于特征融合和扩展卷积,有效提高了小目标多尺度信息的利用率。上述改进的 模型主要是基于基础网络的改进和特征融合方式的改进提高检测效果。此时,网络结构复杂度增大,以牺牲检测速度为 代价 获 取 更 高检 测 精 度,仍 无 法实 现 实 时检测。综上所述,道路目标检测场景中行人目标检测存在应用环境复杂、行人目标遮挡以及精度低,且需兼顾检测速度的问题。本文设计了一种基于改进 算法的道路行人目标检测算法。采用具有噪声的基于密度的聚类方法(,)分析后并选用 聚类算法分析以选择尺度适当的 ,进一步提高 算法模型学习效率;提出了一种改进型特征检测模块,该模块可以有效
6、地实现特征增强与特征融合机制,更好地利用输入特征从而提高检测精度;选用 函数修正 原损失函数,优化正负样本不均衡的情况。原 算法 网络结构中,为特征提取模型。在此基础上,通过添加自定义卷积层,形成新的卷积模型,以获得局部特征信息而后进行目标检测。网络结构如图所示。图 的网络结构 网络检测的基本过程如下:将 原始图片输入到基础网络中,并依次使用 的 、的 、的 、的 、的 、的 这个辅助卷积层进行卷积操作,得到预测目标的特征信息,而后利用检测器预测目标位置及所属类别。最终使用非极大值抑制算法(,)得 到 最 终 检 测结果。尺度如式()所示,其位置公式如式()所示,其对应边界框公式如式()所示。
7、,()(,)()(,)()式中:、为 长、宽;、为 中心坐标;为面积;为系数因素;为距离。中 与真实目标的匹配原则为,对于 而言,如果真实目标与 的 值相等或超过一定阈值,即为正样本,反之则 为负 样 本。算法虽设置匹配原则,但密集采样造成正负样本严重不平衡。为保证检测效果,在选择训练的负样本时遵循难例挖掘的原则,即选取困难负样本。网络训练的损失函数为多任务损失函数,总损失函数是分类损失和定位损失的加权和:国外电子测量技术北大中文核心期刊(,)(,)(,)()式中:为分类损失;为定位损失;为 的正样本数量;为当前预测框的类别匹配信息;为类别置信度预测信息;为预测框信息;为检测框的真值。改进 算
8、法的网络结构 数据集 聚类算法目标检测中 算法不仅要学习目标类别,更需要学习到目标大小与位置。为使得目标检测任务的完成引入 ,合适尺度的 会使得 算法模型更容易学习;并且通过设置不同尺度的 将提高目标物体与 的匹配概率,从而提高 提高道路行人目标的检测精度。为解决原 算法的 尺度无法满足道路场景中行人目标的检测问题,本文对 尺度进行优化,利用 聚类算法,在训练数据集中选择合适的 尺度。首先,利用 分析样本分布的紧密度,去除聚类结果中的噪音声与孤立点,生成新的样本并为新的样本分布赋值;然后,使用 确定聚类中心,根据重叠度(,)选择合 适 的 尺度。聚类过程中 算法距离公式定义如下:(,)(,)(
9、)式中:为样本框大小;为聚类框大小;为 聚类算法产生的聚类中心;为样本框大小和聚类框大小的交互比,作为两个框大小相似的度量。聚类算法的具体实现过程如下。步骤)在训练数据集中提取并存储图像尺寸与目标框信息(,)。步骤)获得目标框宽度与高度(宽度为 和 差值,高度为 和 差值)。步骤)自适应缩放训练数据集中图像的尺寸,并以相同比例缩放目标框尺寸,得到(,)。步骤)初始化 聚类算法,在获得的(,)中随机选择个(,)作为聚类中心,这就是初始化的个 。步骤)计算每个(,)与初始聚类中心之间的距离。根据距离分类,每个(,)归入距离最近的 中。步骤)在步骤)中,所有(,)初步划分为类,此时使用 聚类算法,重
10、新确定每个类中的聚类中心。步骤)重复步骤),直到计算出的距离不再变化。这时,聚类中心即为 。本文数据集选取 数据集中的 类别,使用 聚类方法聚类分析该类别的样本框。聚类算法分析后确定 的值为,最终通过 聚类算法对样本聚类分析后,选取对应先验框的长宽分别为(,)、(,)、(,)、(,)、(,)、(,)、(,)、(,)、(,)。改进特征图检测模块同一张图片中目标类别不一且目标比例信息与位置信息均不同,此种情况会给目标检测带来一定的难度。浅层卷积层预测小目标,但浅层卷积层特征结构比较简单且特征信息极易受到干扰;并且小目标信息会随着网络的加深,在高层卷积层中被丢掉,从而造成小目标检测效果不佳。因此,本
11、文采用一种改进的特征图检测模块。其框架如图所示。图改进 网络结构首先使用 的卷积核对 、(简称 )进行卷积操作,得到 、(简称 )个新特征层。由于 的特征信息较丰富,且特征图尺寸较小,因此本文 无需特征增强,仍保留原始特征信息。在特征融合模块中,采用 轻量级特征融合,主要体现在特征层的尺寸与维数无需调整。融合策略为将原特征层 、分别与新特征层 、,进 行 特 征 融 合,得 到 融 合 后 的 特 征 层 、。选用融合后的特征层构建新的特征金字塔网络,之后在新的特征金字塔网络上完成对目标的分类和定位。特征融合策略图如图所示。函数的引入损失函数作为量化预测值与真实值差异的评判依据,其目的是使得模
12、型可以向真实值的方向预测,并且在很大程度上影响着网络模型的结果。函数公式北大中文核心期刊国外电子测量技术图特征融合结构如下:()()()式中:为类别的预测概率,()为调制因子,为调制参数。当很小时,()趋近于,此时损失函数中样本权重不受影响;当很大时,()趋近于,损失函数中样本权重明显下降。损失函数中分类置信度损失采用 ,其定义如下:(,)?()?()()由式()可知,正样本误差和负样本误差构成分类损失误差,存在正负样本不均衡的情况。为保证网络结构稳定性,本文通过引入 损失函数替换 损失函数修正损失函数,构建新的分类置信度损失函数如下:()()()()()式中:为第个样本被预测为正样本或负样本
13、的概率,为可调至因子。当时,此时 函数与 函数等同;当增加时,()也增加,通过平衡易分样本调低权值的比例。实验结果和分析基于改进型 算法,本文通过选取 数据集中 类比较不同目标检测算法的检测精度和速率验证改进型 算法的有效性。本文选用评价指标,平均精度()和帧速。可较好反映该算法的查准率与查全率,更全面地衡量模型性能;帧率可直观反映模型检测速度。实验环境和参数设置 数据集为自动驾驶的评估数据集,其图像取自真实场景,每张图像类别信息丰富,目标位置存在遮挡。本文实验训练和测试对象为 数据集中 类,共选取 幅图像,幅图像构成训练数据集,幅图像构成测试数据集。实验基于 平台,为 ,显卡为 。编译 环
14、境 为 ,编程语言为 。网络训练时对改进 算法权重的初始化采用传统 在 数据集上训练得到的权重。其训练参数设置如表所示。表训练参数设置迭代计算批量大小初始学习率动量权重衰减系数 随着迭代次数的增加,在 次迭代中学习率降低为;在 次迭代中学习率降低为 ,此时损失函数进一步收敛。实验验证和分析)优化前后比较分析表为 数据集的 类中 算法 优化前后的检测结果对比。从表可以看出,优化后,算法的平均精度提高了 ,检测速度达到了 。表不同 测试结果方法 帧率 优化 后 )特征图检测实验比较分析表为改进 算法特征图检测前后对 数据集 类的检测结果比较。从表可以看出,经过特征图检测后,算法的检测精度提高了 。
15、由于网络结构复杂性的增加,牺牲了一定的检测速度,但与原 算法基本持平。可以证明,特征图检测的改进对检测速度的提高有一定的提升。表特征图改进前后检测结果方法 帧率 改进特征图后 )损失函数实验比较分析为保证损失函数改进的有效性,本文对 数据集 类进行损失函数改进前后 算法的对比实验。在保证 尺度不变,只改进损失函数的条件下得到的检测结果如表所示。从表可以看出,与原 相比,改进后的损失函数 的检测精度提升至 ,检测速度提高至 。此实验证明引入 函数可以有效地提高行人小目标的检测精度与速度。国外电子测量技术北大中文核心期刊表不同损失函数测试结果方法 帧率 改进损失函数的 实验结果)行人目标检测结果为
16、直观评估改进 算法对小目标检测的效果,本文选取组道路图片分别与 、改进型 进行对比。对比算法检测结果如图所示。由图可知,与 解决了部分行人目标 问题,但检测精度不高且仍存在行人目标漏检问题。在 基础上,通过优化 尺度、改进特征金字塔网络结构以及修正损失函数后,可在图中直观感受到道路图像中行人目标的检测精度有所提高。为进一步验证改进 算法的小目标检测效果,本图小目标检测结果实验基于检测精度()、召回率()以及三个评价指标验证改进的 算法的有效性。检测精度计算公式如式()所示,召回率计算公式如式()所示,计算公式如式()所示。()()()式中:为正样本被标记为正样本的个数;为负样本被标记为正样本的个数;为负样本被标记为负样本的个数;正样本被标记为负样本的个数;为对检测准确率和召回率的调和平均。在 数据集的 类中 和改进型 在检测精度、召回率和的数据比较如表所示。由表可知,本文改进型 的检测精度为 ,召回率为 ,为 。与原 相比,检测精度提高了 ,召回率提高了 ,提高了 。改进型 对提高道路行人小目标检测的准确性和速度具有显著效果。)与其他目标检测算法结果比较为进一步验证本文改进型 算法提高