1、第 卷 第 期 年 月南京工程学院学报(自然科学版)().:./.投稿网址:/.基于姿态估计的驾驶员分心驾驶状态分类算法研究张剑书王浩然王彦博赵柞旭(.南京工程学院计算机工程学院 江苏 南京.南京师范大学计算机与电子信息学院 江苏 南京)摘 要:大量研究证明驾驶员分心驾驶与交通安全性降低之间存在很大的关联.采用 算法检测人体并用人体姿态估计系统检测人体骨骼关键点利用欧氏距离、角的余弦构建特征并用 判定函数进行特征选择利用筛选高精度子树的方式去除传统随机森林算法中表现较差的树以 统计量作为评估决策树相似度的标准利用谱聚类算法选择一致性低的决策树作为子树来改进随机森林算法运用改进前后的两种随机森林
2、算法在分心驾驶数据样本上进行试验并比较.结果表明在相同数量的子树下改进的随机森林算法比传统算法检测精度高具有更好的鲁棒性和泛化能力.关键词:姿态估计随机森林谱聚类深度神经网络中图分类号:.收稿日期:修回日期:基金项目:江苏省高等学校大学生创新创业训练计划项目()作者简介:张剑书硕士实验师研究方向为视频图像处理.:.引文格式:张剑书王浩然王彦博等.基于姿态估计的驾驶员分心驾驶状态分类算法研究.南京工程学院学报(自然科学版)():.第 卷第 期张剑书等:基于姿态估计的驾驶员分心驾驶状态分类算法研究 分心驾驶行为是指驾驶员在驾驶时将注意力集中在与正常驾驶不相关的活动上这会导致驾驶员对突发事件的反应速
3、度下降、增加交通事故发生的概率、造成不必要的生命和财产损失.根据美国国家公路交通安全管理局提供的数据 年美国致死交通事故中有 与分心驾驶相关且 岁的驾驶员占死亡比例最大.中国在中华人民共和国道路交通安全法实施条例第六十二条(三)项中已明确规定:驾驶机动车时不得出现拨打接听手持电话、观看电视等妨碍安全驾驶的行为.然而大部分驾驶员对分心驾驶的危险性缺乏普遍认知.国内外众多学者都在积极开展有关分心驾驶行为检测的研究工作.目前对驾驶员分心驾驶行为的检测可分为接触式和非接触式.文献采用基于脑电图的大脑动力学对驾驶分心的反应进行研究但接触式方法穿戴设备成本较高且容易引起驾驶员分心难以应用到实际的驾驶环境中
4、文献 采用面部行为分析工具(.、)提取面部特征来识别驾驶员分心驾驶的方法但白天光线较强或夜间光线较弱检测出人脸的概率会下降并且这类方法主要是检测疲劳状态对分心行为检测并不全面文献采用多种传感器数据作为识别分心驾驶行为的特征但是这需要多种高质量传感器的支持且传感器与控制系统之间需保持高速稳定的数据传输增加了成本文献 采用改进的卷积神经网络()自动提取有效特征利用长短期记忆神经网络()或全连接网络()进行分类该类方法虽取得了一定的效果但深层网络仍存在训练过程缺乏可解释性的问题.本文 提 出 一 种 基 于 人 体 姿 态 估 计 系 统()的驾驶员分心驾驶行为检测方法通过 算法和 提取驾驶员人体骨
5、骼关键点的位置信息再对驾驶员分心驾驶行为进行分析与挖掘采用 判定函数选择有效特征可大大降低分类模型输入特征的维度对随机森林算法进行改进相较于传统的随机森林算法可以用更少的子树获得接近的检测性能.驾驶行为特征提取.姿态估计利用 算法和 从图像数据中提取目标对象的 个人体骨骼关键点在实际情况下可以忽略摄像头无法捕捉到的驾驶员左脚踝和右脚踝这两个关键点只对 个关键点进行分析.采用传统的自顶向下的方法骨骼检测示意图如图 所示.先用目标检测算法检测驾驶员再用单人姿态估计()算法识别驾驶员的姿态.图 基于 的姿态估计结果示意图由图 的 个人体骨骼关键点数据构建有效的模型输入特征.当人的姿态发生变化时各关节
6、之间的距离以及角度相应地也会发生一定变化.将 个人体骨骼关键点两两求取二维空间的欧式距离得到 维的向量计算公式为:()()()根据余弦定理和取得的两个关键点之间的欧氏距离求取 个关键点中每 个关键点所构成三个角的余弦值共计 维.将构建的距离特征和角度特征合并共有 个特征值即每个包含特征值的向量是 维.特征提取由于基于姿态估计方法构建的特征属性多容易引发维数灾难且这些特征是通过穷举得到没南京工程学院学报(自然科学版)年 月有进行筛选混杂了很多不相关特征增加了学习任务的难度.因此通过引入多分类 准则函数来选择特征对于给定数据样例异类样本类间均值之差最大同类样例类内离散度最小.多分类 准则函数的定义
7、为:()()()()()()式中:为分类问题中包含类别的数量为数据集中第 个类别包含的样本的集合为第 类中的样本数量为一个样本数据为第 类别中所有样本特征数据均值 为数据集中所有样本特征数据的均值.将全体数据集代入 准则函数每一个特征对应一个 准则函数的函数值然后将每个特征对应的 函数的函数值从大到小排序后再累加得到 函数值累计函数变化曲线如图所示.由图 可见随着特征数量的增加函数的累计值逐渐增加当特征数增加到 后 函数累计值的增速趋缓可以认为当特征数量为 时 函数的累计值趋于收敛再增加特征数量对于分类性能的提升不大.因此选择前 个特征用于驾驶员行为分类.图 函数值累计函数变化曲线基于改进随机
8、森林算法的驾驶员行为分类 在传统决策树和随机森林分类算法的基础上提出一种基于谱聚类改进的随机森林算法对驾驶员异常行为进行准确、高效的分类.高精度子树筛选随机森林算法属于 系列的集成学习算法基于自助采样法实现.训练集中 的样本进行训练剩下 样本用作验证集进行“包外估计”来验证算法的泛化性能.保留在验证集数据上分类准确率大于阈值 的子树剔除分类精度较低的树提高整体随机森林算法的准确率.筛选后的随机森林算法在分类性能和分类效率方面可以得到进一步的增强.引入一致性检验方法 统计量来衡量随机森林中各决策树的相似度.假设随机森林算法中有两个决策树 和 这两个决策树对同一样本分类一致性用 统计量 表示:/(
9、)()式中:为两个分类器预测类别相同的样本数量之和除以总样本数为分类器预测样本为某类别的个数与另一个分类器预测样本为同样类别的个数乘积之和除以总样本数的平方.通常 统计量()值越趋近于 表示两个决策树分类器越相似.为了将相似度高的两个决策树聚集到同一个簇内 以 作为谱聚类中距离的度量使相似的决策树模型分到同一个簇内在此基础上可以得出随机森林中任意两个子树之间的相似度混淆矩阵.基于谱聚类改进的随机森林算法假设两个子树相似度的混淆矩阵 中每一行作为样本点 利用基于高斯核函数的 算法可以计算样本空间的相似度矩阵:()式中 为标签特征维数.根据只要一个点在另一个点的 近邻中则保留 的原则构建对称的 相
10、似度矩阵即邻接矩阵:()式中()且()()或().根据邻接矩阵 计算拉普拉斯矩阵:()第 卷第 期张剑书等:基于姿态估计的驾驶员分心驾驶状态分类算法研究矩阵 的对角元素 其余元素为可以由邻接矩阵 计算得到.在此基础上利用 切法计算出标准化拉普拉斯矩阵 的前 个最小的特征值对应的特征向量组成的特征矩阵 并对 的每一行进行归一化处理最后用 算法聚成 类.本文采用 分数评估谱聚类的结果以便调整谱聚类高斯核函数值的大小.分数通过评估类之间方差和类内方差来计算得分:/()()()式中:为聚类类别个数 为全部数据数为类间方差为类内方差.试验与分析.数据集与参数设置采用美国 公司发布的公开驾驶行为数据集训练
11、驾驶员异常行为检测模型数据集中图像为车内摄像头拍摄的志愿者在农场模拟各种驾驶行为的视频快照.该数据集包含 幅带有行为标签图像将其中的 张图像和标签作为训练集剩余的 张图像和标签作为测试集.这些样本在各类之间分布均匀图像尺寸为 正常和异常驾驶行为分为 个类别驾驶行为数据示例如图 所示.图 驾驶行为数据示例 采用高斯核进行谱聚类并对聚类后类簇的个数(同时也是投影子空间的维数)和核函数参数 进行调整并选择最优参数.通过试验发现当 .时 分数最高.因此经过去除一致性筛选后子树可以聚成 类.从每个类中选取在袋外数据表现较好的前几棵子树去除性能差的子树重新组成森林.基于谱聚类优化的随机森林算法性能试验基于
12、 的 和 库实现了大规模开源数据集的数据清洗和数据预处理在此基础上基于 库开发了基于谱聚类优化的随机森林算法实现驾驶员异常行为分类.为了对改进的随机森林算法进行评估将具有同等数量子树的传统随机森林算法和改进的随机森林算法进行对比采用 折交叉验证来测试改进前后的准确率.初始训练 棵子树当树的最大深度设定为 时所有的子树均可收敛并且模型在测试集上宏观和微观均表现较好.当保留子树设定的准确率阈值 为.聚类簇值达到 以上时改进随机森林算法准确率达到 以上.传统随机森林算法与改进的随机森林算法在相同的测试数据集上的准确率对比如图 所示.图 改进前后随机森林算法准确率比较由图 可见本文提出的随机森林算法在
13、 棵树时就可以达到 左右的准确率而传统随机森林算法需要 棵树才能达到相同准确率这表明本文算法可以以更少的复杂度实现与传统随机森林算法相当的性能.图 为决策树数量为、树的最大深度为 的改进随机森林算法准确度对应的归一化混淆矩阵.由图 可见除了化妆整理头发可能会因为动作的相似性导致被误判为打电话算法对其余南京工程学院学报(自然科学版)年 月异常行为的分类准确率基本都在以上.图 归一化后的混淆矩阵用分类准确率、召回率 和 分数这 个指标进一步量化模型的分类性能准确率、召回率和 分数的计算式为:()/()/()/()()式中:为将正类预测为正类的数量 为将负类预测为负类的数量 为将负类预测为正类的数量
14、 为将正类预测为负类的数量在 公司公开的驾驶行为数据集上本文算法和基于 模型、模型、融合模型的异常驾驶行为检测性能比较结果见表.由表 可见本文算法性能最优.本文算法是提取人体骨骼关键点的像素坐标根据消除纲量后的距离和角度特征来检测行为不易受到图像像素值大小、拍摄角度等影响模型泛化能力比针对图像数据训练得到的 模型更强.表 四种模型异常行为检测性能比较模型准确率/召回率/分数/模型大小.融合.本文算法.结语本文提出一种基于谱聚类改进随机森林算法进行驾驶员分心驾驶识别依据此算法和特征选择后的有效数据挖掘出人体姿态特征与驾驶员分心驾驶状态之间的联系得出一种高精度的驾驶员分心驾驶识别模型.针对驾驶员分
15、心驾驶行为的特征提出以人体骨骼关键点的位置信息作为分类特征.相较于深度学习检测方法本文算法在保证准确率和算法效率的同时更容易理解和解释具有可知性.同时通过 函数对原始特征进行快速降维可以有效减少后续改进随机森林算法的计算负担.改进的随机森林算法选择泛化性能好且具有代表性的决策树组成新的森林不仅提高了算法的准确率和速度也提升了算法的鲁棒性和稳定性.参考文献:.:.:.张宇阳桥本成仁.社会资本等因素对手机分心驾驶危险度认知的影响.科学技术与工程():./.:.刘佰强.基于人脸视频智能分析的日间驾驶员不安全行为检测分类与预警系统.西安:西安理工大学.吴士力唐振民刘永.多特征融合的随机森林疲劳驾驶识别算法.计算机工程与应用():.张俊.基于车联网数据的驾驶行为识别与风险评估方法研究.合肥:中国科学技术大学.陈军张黎周博等.基于级联卷积神经网络的驾驶员分心驾驶行为检测.科学技术与工程():.李力.基于 和 的驾驶员疲劳和分心状态识别研究.长沙:湖南大学.蔡晓妍戴冠中杨黎斌.谱聚类算法综述.计算机科学():.李玉王利周志平等.基于 聚类改进随机森林算法的专利价值评估方法.科学技术与工程():.