基于卷积神经网络的图像分类研究与应用_侯星晨.pdf-资源下载-蜗牛文库-知识共享服务平台

基于卷积神经网络的图像分类研究与应用_侯星晨.pdf

1、电子元器件与信息技术|93人工智能与智能制造基于卷积神经网络的图像分类研究与应用侯星晨，杨玉郑州财经学院，河南郑州450000摘要：现阶段在开展目标检测工作时，当需要更换检测目标时就需要完成卷积神经网络的重新训练，导致在更换检测目标时投入更多的训练成本，花费更多的时间，降低了目标检测的准确率和效率。针对这种问题，提出了准确划分检测目标各个检测状态的种类，对输入的图像实时使用卷积神经网络图像分类模型完成图像分类，借助图像分类类别来完成检测目标状态判定。测试表明，这种方法能够满足检测目标快速更换的要求，能够极大提高检测目标的准确性，同时也在很大程度上降低了训练成本。关键词：图像

2、分类；卷积神经网络；图像检测中图分类号:TN919.81 文献标志码:A DOI:10.19772/ki.2096-4455.2022.11.022 0引言在日常生活中人的眼睛可以快速判别所看到的物体，然而，对于机器而言这是非常困难的一项任务，借助计算机有效地处理图像是计算机视觉中的重要研究内容。随着手机、移动互联网、便携摄影等与人们生活的联系越来越密切，为计算机终端完成大量数据的获取提供了方面。而随着深度学习、机器学习、信息技术等技术越来越成熟，计算机图形学也进入了快速发展的阶段。特别是在卷积神经网络的应用越来越广泛后，在很大程度上提升了计算机识别图形的精度1。但是现在使用的图像检测大多是以

3、特定的目标作为识别对象，出于提升识别精度的目的，会针对特定目标处于各种状态的图像开展次数较多的深度学习模型训练。然而这种模型无法满足通用性较高的要求，一旦使用这种模型检测其他目标，必须再经历一次繁琐的模型训练工作，检测效率比较低。在本次研究中将在图像检测过程中简化深度学习，只需要完成目标状态的简单记录就能够将模型转变为该目标的检测模型。1图像分类概念图像分类就是与图像所反映的实际特征相结合，有效的区分不同领域图像的过程，也就是将一张图片输入到计算机中，计算机需要在已有的类别、标签中判断图片属于哪个类别2。举例来说，在一堆有动物、风景、物体的图片中，计算机完成任意一张图片的接收，都需要将图片划分

4、到具体的物体类别中。图片识别虽然看起来较为简单，但是其中拥有很多需要攻克的难题，例如计算机在开展图形识别工作时，其识别的精准度会受到背景、光线、旋转角度等因素的影响。早期的人工智能方法借助被识别物体的定义利用专家系统等方式来有效识别抽象的物体。随着统计机器学习越来越成熟，在图像分类领域计算机技术的应用也越来越广泛。在完成图像分类的过程中主要是利用统计机器学习中的有监督学习方法，通过将拥有特定标签的数据主动喂给计算机，完成算法、策略、模型的建立，从而达到有效识别物体的目标3。作者简介：侯星晨，男，河南周口，硕士，助教，研究方向：深度学习、计算机视觉。dianzi yuanqijian yu xi

5、nxijishu 电子元器件与信息技术94|2图像分类及检测算法2.1Inceptionv1模型在本次研究模型为Inception v1，该网络模型的主要特点就是当无法控制计算爆炸和计算较为简单时，能够利用在各个阶段建立更多的单元数目，来使网络的深度和宽度得以提升4。同时Inception v1在多尺度处理图像后，能够整合图像处理结果，能够为下一阶段完成不同图像尺寸下特征的提取提供方便。其模型结构由1个最大池化层、1个中型的33卷积层、1个大型的55卷积层以及1个11卷积层构成。在这个模型结构中11卷积层的主要作用就是负责自身所处地点所经过图像的细节信息特征提取，同时对于前面

6、输入的大部分图像信息55卷积层都能够纳入管理范围，从而明确其中的图像信息特征。在这个过程中输入图像映射维度能够通过池化操作而降低自身大小，能够对过度拟合起到一定程度的预防作用。另外，将修正线性单元添加在每个卷积层后，能够使网络的非线性特征得到有效改善，Inception v1模型结构如图1所示。11卷积层33卷积层55卷积层11卷积层连接通道11卷积层11卷积层33最大池化层预处理图 1Inception v1 结构2.2网络模型结构以现有的卷积神经网络GoogLeNet模型结构为基础，通过合理的优化措施建立全新的图像分类模型，从而达到改进网络模型结构的目标，图2为改进后的具体模型结构。在开展

7、模型训练前首先应该完成以下参数的确定。在本次模型中使用Softmax分类器，其类别属于归一化概念，这种分类器可以通过（0,1）内表达出计算结果，1是所有结果相加之和，并且相加所有结果的最终结果如式（1）所示。=kzzjkjeezp）（1）其中Z表示向量，j个表示元素所处的序号，Pj表示Z向量第j各元素所代表的Softmax值。输入77卷积层修正线性单元最大池化层11卷积层33卷积层修正线性单元最大池化层5Inception最大池化层5Inception平均池化层Dropout正则化内积Softmax分类器图 2卷积神经网络结构示意图损失函数：这一参数主要是用于确定模型实际值与理论值之间存在的偏

8、差，在正常情况下，拥有越小的损失函数证明模型的测试结果与实际值越接近。在本次研究中使用Softmaxloss函数作为损失函数，如式（2）所示。（2）其中，W代表网络的权值矩阵，b就是数值偏差，y是模型测试的实际结果，分类器输出结果用pj（z）表示5。Dropout正则化：其主要能够在权重衰减方面发挥作用，通过这种方式能够使Softmax分类器存在的参数冗余的数值问题得到有效解决，并且可以使模型拥有更强的泛化性，在Droppout正则化网络后使用如下几个公式。）（：pernoullirjB（3）（）（）（yry=（4）（）（）（1i1i1ibywz+=（5）电子元器件与信息技术

9、|95人工智能与智能制造（6）从上述几个公式中可以看出：在函数中必然会存在一个向量的参数是1或0，然后再与权重参数相乘，因为有随机为1或0的参数在公式中存在，必然会导致部分权重失去应有的效果，从而发挥预防拟合情况的效果。优化算法：为了使对计算时间和计算资源的需求得到进一步降低，将随机梯度下降法融入其中，这种方法能够在数据较少的情况下有效地更新训练模型，同时出于使学习速度更快的目的，将在其中加入合理的动量参数，如以下公式所示。（7）t=（8）其中损失函数为)(J，网络学习率为，0.9为的取值，0为t的取值。3模型训练与结果与已经选择的参数和设定的网络结构相结合有效地开展训练网络的工作，通过Caf

10、fe深度学习库函数式模型的利用搭建出整体的网络结构，同时选择0.01的取值，借助随机梯度下降法来实现计算时间和计算资源的减少。在累计完成10000次左右的数据迭代训练后，借助不断调整网络参数来完成网络模型的建立。在训练完模型后，将会计算出accuracy、test loss、train loss三个参数随机迭代次数变化曲线，最后能够准确评估训练模型的整体网络性能6。通过分析相关的数据可以看出，当拥有越多的迭代次数时，就会拥有越高的模型准确度accuracy，就会拥有越低的test loss和train loss。在拥有约5000次的迭代次数后就能够得到接近1的准确度，在这时test loss和

11、train loss的值与0也非常接近。与这个结果相结合，该模型的稳健性优势非常突出，并且拥有非常全面和良好的使用性能。在目标状态图像分类检测中，为了使CNN模型的迁移学习效果得到更加充分的展现，将在评估模型的过程中使用分类准确率这一指标，使用测试目标状态总次数和分类准确目标状态次数两个参数计算准确率（A），具体使用以下公式。%100allacc=NNA（9）其中测试目标状态的总次数用Nall表示，分类准确目标状态的次数用Nacc表示。在CNN急速芯片中放入完成训练和转换的模型，然后有效采集目标各种状态图像，借助裁剪旋转的方法得到各种状态下目标的图像分别1000张。通过合理的处理使图像拥有相同

12、的大小，在本次研究中图像的分辨率设置为2242243，然后有效的标记状态和完成数据集的获取，以获得的数据集为基础完成新模型的更新，对模型的准确率进行测试。在开展测试实验的过程中通过完成小灯亮灭状态的检测来完成准确度测试，经过处理后将会得到1000张小灯亮和1000张小灯灭的图片。然后在以上两类图片中分别选择数量相同的图片作为数据集，最后在图片数量不同的数据集下分别完成目标状态检测准确率的测试，具体结果如表1所示。表 1数量不同的数据集下检测准确率组别数值数据量900600500400300200准确率99.90%96.08%96.02%91.21%87.75%74.23%结合上表的数据可知，在

13、不断降低检测目标数据集数量的过程中，也会逐渐降低该模型检测目标的准确性，当拥有900数量的数据集时，该模型能够达到99.9%的准确率，证明该模型用于图片分类的准确性非常高。在数据集的制作过程中，本次研究已经对应用场景的复杂性和多样性进行了充分考虑，所以只需要与实际的应用场景相结合进行较小的调整就可以正常使用7。4设计嵌入式报警系统4.1图像检测报警系统在本次研究过程中还以深度学习卷积神经网络为基础设计出了图像检测报警系统。其中dianzi yuanqijian yu xinxijishu 电子元器件与信息技术96|使用XCKU115板卡（Xilinx公司）作为CNN加速芯片，

14、将CKS32F103主控芯片合理融入嵌入式系统。在这个系统中，相机最先发挥作用，能够完成采集各种状态目标图像的工作，完成标记分类工作使数据集生成，嵌入式系统的存储器会储存这些数据集，通过在嵌入式系统中合理选择需要报警的图像类型，然后在通过以分类数据集的利用有效完成卷积神经网络图像分类模型的调整，至此系统初步设置已经完成，已经能够完成实时检测目标图像的工作，目标的状态能够实时显现在相机中，并且新生成的模型中能够实时接收相关的影像，从而有效划分影像种类，嵌入式系统实时完成结果接收工作。最终嵌入式系统将对比图像结果与设置的报警图像类型是否一致，若是确定其为报警图像类型，将会自动完成报警工作8。因为卷

15、积神经网络模型需要输入规定格式的图片，所以应该有效完成预处理相机输入图片的工作，其中的主要工作就是调整IMAGE_MEAN、IMAGE_STDDEV、IMAGE_DIM等参数，在实际工作中大多设置0.0078的范围、3通道数以及224224的图像大小。因为本次算法拥有较高的预处理要求，所以在开展预处理工作的过程中使用Python工具包。4.2设计系统响应嵌入式系统的主要作用就是筛选事先设置的图像类型，其拥有如图3所示的驱动流程。返回值Value读取Value是否在20以上开始概率是否在7以上蜂鸣器结束是否否是图 3嵌入式系统驱动流程为了使因误判图像类型导致的误报警几率得到降低，将以下处理融入本

16、系统：当满足概率在7以上和Value在20以上的要求时报警程序才会启动，通过这种方式能够使误报警的几率得到有效降低。4.3系统测试在本次研究中的检测目标为LED灯，主要目的是完成LED等亮灭状态检测。报警状态的图像类型设置为LED灯亮的图像，正常状态的图像类型为LED灯熄灭的图像。完成测试平台的搭建后，相机准确记录LED灯的两个状态，在完成记录后使数据集生成，并且完成图像分类模型的更新生成，然后再借助相机完成LED等拍摄，整个系统持续运行完成LED灯状态实时检测。通过这种方式，系统能够在显示器中实时展现在每帧图像中LED处于两种状态的概率，使用拥有最大出现概率的状态作为LED灯当前所处状态，并在每帧图像上完成图像类型的显示。然后会向嵌入式系统中发送所显示的类型以及概率，概率在0.7以上且连续20帧使，如果反馈的为报警图像类型，就会启动蜂鸣器。经过多次试验的结果证明，本系统在检测、获取、响应、分类图像数据的过程中能够有效满足准确性和实时性两个方面的要求。5应用领域与展望随着图像分类精度变得越来越高，将会有越来越多的人开始认可卷积神经网络模型的应用价值，其应用领域也将变得越来越广泛。例如在

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？