基于YOLOv5的服装熨烫目标检测算法研究

资源描述

1、第卷第期青岛大学学报（工程技术版）年月（）文章编号：（）；：基于的服装熨烫目标检测算法研究姚明杰，李斌，陈世海，李晓帆，麻方达，符朝兴（青岛大学机电工程学院，山东青岛）摘要：针对服装熨烫行业中熨烫目标分类模糊、人工方式导致检测不准确且效率低的问题，本文将算法运用到服装行业熨烫目标检测中，将常见的熨烫目标分为裤兜、缝线及褶皱，建立对应的数据集并标注。同时，通过数据集训练算法模型，对模型进行评价和测试，得到模型准确率达，召回率达，平均精度均值达。同时，选择张熨烫目标图像，对模型进行测试实验。实验结果表明，该模型对裤兜、缝线和褶皱的识别率分别为，和，检测置信度

2、为，检测效果较好，满足实验要求，实现了常见服装熨烫目标的识别、分类及定位。该研究提升了服装熨烫行业的生产效率。关键词：；目标检测；服装熨烫；深度学习中图分类号：文献标识码：收稿日期：；修回日期：作者简介：姚明杰（），男，硕士研究生，主要研究方向为物联网及人工智能。通信作者：符朝兴（），男，博士，副教授，主要研究方向为人工智能和机械运动。：纺织服装行业素有“三分缝七分烫”的说法，服装熨烫在服装生产过程中非常重要。目前，在服装熨烫过程中，服装熨烫目标的检测和识别主要是通过人工方式进行，但由于服装表面纹理复杂，熨烫目标的形状、大小各不相同，人工检测存在视觉疲劳和个人情绪对检测结果的影响，不能保证检

3、测的准确率和效率。此外，人工检测的评判标准受个人的专业能力和主观判断影响大，导致识别标准不统一。机器视觉是将人工智能技术运用到工业生产的重要体现，主要指使用视觉设备获得外界环境的实时图像，对图像中的目标快速定位，并对目标的空间位姿进行解算。目标检测是计算机视觉中的重要组成部分，其通过对图片中目标区域计算，获得目标区域坐标，并对目标进行分类，为后续任务提供数据支撑。目标检测算法通常分为种，即传统目标检测算法和基于深度学习的目标检测算法。与传统的目标检测算法相比，基于深度学习的目标检测算法可以提高特征识别的自主性，不再依赖于经验提取，提高了识别效率和定位准确性。等人在目标检测上首次使用深度学习

4、，提出模型，并提出具有感兴趣区域池化（，）的，然后加入区域提取网络结构（，），并生成候选框，从而得到；等人提出算法，通过新的损失函数解决类别不均衡问题；李姜楠等人提出基于图像对一阶段目标检测的特征提取层和特征融合层同时处理的方法，有效提高了特征提取的准确率。目前，对服装熨烫目标检测方法的研究较少，且主要集中在通过机器视觉对布匹瑕疵的检测。张丽瑶等人采用单次检测（，）网络，对种织物瑕疵目标进行检测与分类，平均准确率达；李宇等人采用目标检测算法，对种常见织物疵点目标进行检测，检测准确率达；等人针对疵点目标小及形状不规则等问题，采用改进的目标检测算法，对织物疵点进行检测与定位，检测

5、平均准确率达到以上；王恩芝等人采用改进的算法，对织物表面缺陷进行检测，准确率高达，说明深度学习在织物的瑕疵检测方面具有检测准确率高、检测速度快的优势，且通过实验对比，得出算法的检测准确率及检测速度均优于和等算法。基于此，本文将算法用在对服装熨烫目标的检测，采集带有缝线、裤兜及褶皱第期姚明杰，等：基于的服装熨烫目标检测算法研究的服装图像，建立数据集并进行标注。同时，针对数据量不足影响模型性能，图像类别不均衡导致过拟合的问题，采用算法增强数据集，并利用数据集训练算法模型，对模型进行评价和测试。该研究在一定程度上提升了服装熨烫行业的生产效率。算法原理网格结构模型网络结构如图所

6、示。模型分为输入端（）、基准网络（）、颈网络（）与输出端（）个模块，下面分别介绍这个模块。图模型网络结构）。在输入端模型训练阶段，首先需要对输入图片进行数据处理，其处理过程采用算法，数据增强算法流程如图所示。将张图片进行裁剪、翻转、缩放等方式处理后进行拼接，对神经网络的鲁棒性起到重要作用。该算法增加了小目标样本，丰富了数据集，极大地提升了对小目标物体的识别能力，适合裤兜、缝线及褶皱等小目标检测的需求。此外，采用自适应计算最佳锚框值和自适应图片缩放方法，对图片进行处理。图数据增强算法流程）。是用来提取输入图像特征的主干网络。采用结构作为主干网络，主要包括和跨级局部网络（，）结构，明显提

7、高了特征提取效果。对和结构进行切片，切片示意图如图所示。青岛大学学报（工程技术版）第卷图切片示意图图中的切片操作就是将张以输入的图像通过隔行切片后，将每隔个像素的取值再组合成一张新图像，得到张的特征图，结构如图所示。结构是将原始图像的长度和宽度均缩小为原来的一半，通道数量增加到原来的倍，提高了运行速度，且最终得到的特征图没有信息丢失。图结构由于卷积神经网络框架结构存在梯度信息重复的问题，导致计算量大且速度慢，本文将应用于中。对于目标检测等问题，在保证检测准确性的同时，可较大提升计算速度。中有种结构，分别是和，和结构如图所示。其中，结

8、构应用在主干网络，结构应用在网络。图和结构第期姚明杰，等：基于的服装熨烫目标检测算法研究图结构）。的结构采用模块，并在结构中加入结构，更好地利用从主干网络中提取特征，提升了特征融合能力，结构如图所示。结构主要作用是生成特征金字塔，通过特征金字塔网络（，）自上而下进行上采样，融合高低层特征提升小目标的检测效果，通过路径聚合网络（，）自下而上进行下采样，使顶层可以获取底层的位置信息，从而提升大目标的检测效果。）。中的结构是用来完成目标最终检测及结果输出，主要负责从主干网络中提取特征，再经过结构的压缩和融合后进行任务分类，最终做出预测。用作为的损失函数，改进

9、了算法中预测框和框不相交时出现的函数不可导，以及当个框大小相同时无法判断重叠的问题，进一步提升了算法的检测精度。在中引入预测框和真实框的最小外接矩形及最小外接矩形与并集的差集，表示为（）（）式中，表示预测框和真实框的交集；表示预测框和真实框的并集；为最小外接矩形。设预测框和真实框的坐标为，（），（，）（）其中，。由此求出和的面积为（）（），（）（）（）则个框的重叠面积为，（），（，），（），（，）（）（），烅烄烆（）最小外接矩形坐标为，（），（，），（），（，）（）最小外接矩形面积为（）（）（）通过损失函数计算的损失值为（）（）在进行目标检测时，生成的预测框不止一个，但里面的内容

10、一般都是相同的，需要使用加权非极大值抑制（，）简化其检测结果。评价指标目前主要采用平均精度均值（，）对目标检测结果进行评价。在实验过程中，对输入图像做出预测，按结果可以分为、类。表示将正确图片预测为正确结果的图片数量；表示将错误结果预测为正确结果的图片数量；表示将正确结果预测为错误结果的图片数量；表示将错误图片预测为正确结果的图片数量。）精确率和召回率。根据以上类样本得到模型的多种评价指标。例如样本中目标的精确度（），即该目标预测正确的数量与所有包含该目标样本的比值，表示为青岛大学学报（工程技术版）第卷（）（）召回率（）代表预测正确的数量与预测为该目标的数量的比值，即（）（

11、）平均精度（，）。为验证集的数量，为目标精确率的平均值，即（）（）（）以召回率和准确率为横、纵坐标，得出的图像称为图，那么图像与坐标系之间的面积为。正确率（）是目标检测结果正确的数量和所有样本的比值，即（）（）为所有的目标类别，用表示所有类别平均精度的均值，即（）（）图图形化）交并比。交并比（，）也是目标检测模型中常用的评价指标，用检测结果的预测框和样本标注框的交集和并集的比值表示，即（）其中，为预测框；为真实标注框。理想状态下，当个目标框完全重合时，值为；其他情况下，值小于，值越接近于，说明个目标框的重叠部分越大，即目标检测效果越好。图形化如图所示。熨烫目标检测实验数据集的准备数据

12、集分析本文使用的实验样本来自网络和自主采集，图片均为彩色且尺寸各不相同，编码格式均为格式，包含不同款式服装的特征，即缝线、裤兜、褶皱和正常类，熨烫目标数据集图片如图所示。数据集共有张图片，其中缝线张，裤兜张，褶皱张，正常类别张图。图熨烫目标数据集图片通过分析数据集，可知数据集的特点如下：）数据集类别不均衡。数据集中正常类别最多，达到张，裤兜类别只有张，这种不同类别样本的数量差过大情况称为数据集类别不均衡。假设二分类任务中，正样本数量远大于负样本数量，则把样本类别比例超过（或）的数据称为不均衡数据。本数据集中，正常类别与裤兜类别的比例超过，属于类别不均衡的数据集。第期姚明杰，等：

13、基于的服装熨烫目标检测算法研究图标记界面）服装熨烫目标特征显著。通过分析缝线、裤兜及褶皱类目标，发现不同衣物、颜色和材质的服装，其熨烫目标的种类较多，形状和大小变化也较大。本文在选择熨烫目标时，选择褶皱特征明显、裤兜形状完整、缝线无遮盖的样本。）图片大小不同。数据集有大小不同的种样本，分别为，的图像。数据集建立的标记界面如图所示。采集的图像数据无法直接训练模型，还需要将每个图像的种类和识别区域进行标签化。本文使用标注工具进行标注，是一种基于的图形可视化标注工具，使用选择熨烫目标区域，并在标签中设置该目标的种类，对应于上文提到的裤兜、缝线及褶皱，标签储存格式为文件，将图片索引、种

14、类、坐标存储在标签中，并以文件格式保存。标注生成的文件如图所示。数据集增强在模型训练中，如果训练使用的数据集数量不足，就会影响模型性能。由于本文采集的数据集数量有限，图像类别不均衡，会使训练出的模型存在偏向性和较差的泛化能力，容易产生过拟合现象。为解决这些问题，需要对采集的图像进行数据增强（，）操作。在模型训练中，常用的数据增强方法主要有图像色彩调整、尺寸变化、随机剪裁、几何变换、添加噪声、条件生成对抗网络（）等。本文使用进行数据增强，是一个的图像增强库，可以通过不同的策略改变图片，以达到数据增强的目的。在目标检测中，数据集包括图像及对应的文件，在对图像增强时，自动解算出标注框和变

15、换后的坐标，并生成对应的文件。数据增强的算法流程图如图所示。图标注生成的文件图数据增强的算法流程图图像增强的参数设置如表所示。表图像增强的参数设置图像增强数量张旋转角度（）水平镜像翻转概率垂直镜像翻转概率明亮度改变比率高斯模糊参数缩放系数经过数据增强，原数据集扩充到张图像，增强后的部分图像如图所示。青岛大学学报（工程技术版）第卷图增强后的部分图像模型训练与评价对于深度学习模型，选择作为深度学习框架，是基于开发的一款神经网络计算的开源框架，实验软件环境如表所示。表软件环境名称版本名称版本操作系统专业版图标准文件是一款开源的、多接口视觉开发软件

16、包，可在、等系统上运行，对和可以提供函数接口。在实际运用时，可直接调用自身的应用程序编程（，）接口函数；对目标定位时，采用中图像翻转、裁剪及叠加的方法处理图像。熨烫目标检测实验需要对搭建的深度学习模型进行训练和评价，训练评价完成后才能进行模型测试与评价。本文在节制作了服装熨烫数据集，并对数据集进行增强，将最终数据集分为训练集和验证集来训练模型，其中训练集占，验证集占。用脚本文件把文件的数据集转换为可用的文件，文件包括标签类别和边界框坐标信息（，），标准文件如图所示。给出本文模型训练时的主要参数，模型训练主要参数设置如表所示。表模型训练主要参数设置迭代运行次数训练图片的分辨率每次送入网络图片数量预训练模型训练过程各项指标变化情况如图所示。图中，为准确率；为召回率；指标中的表示多类别平均精度，为判定正负样本的阈值；指标中的，表示阈值取后再取均值，为调和均值。训练过程各指标具体含义已在节算法的评价指标中予以说明。第期姚明杰，等：基于的服装熨烫目标检测算法研究图训练过程各指标变化情况由图可以看出，该模型达到了收敛状态，精度和召回率均达到了，训练集

展开阅读全文

基于YOLOv5的服装熨烫目标检测算法研究_姚明杰.pdf