1、电子技术应用 2023年 第49卷 第4期Artificial Intelligence人工智能基于 CNN 的智慧农场图像分类方法*杨诒斌1,2,王俊强1,2,柴世豪1(1.中北大学 仪器与电子学院,山西 太原 030051;2.中北大学 前沿交叉科学研究院,山西 太原 030051)摘 要:为解决新疆兵团农业现代化建设中有感知无决策的问题,提出一种基于注意力机制模块(SENet)与卷积神经网络混合模型迁移学习的图像分类方法(TL-DA-SE-CNN)。该方法选择 4 种不同的 CNN 模型进行权重采集,包括VGGNet、ResNet、InceptionNet 和 MobileNet。模型使
2、用 SENet 分类器代替卷积神经网络的全连接层,提取图像的结构性高阶统计特征进行主题分类,并使用 BP 算法进行参数调整,分类准确度达 98.20%。实验结果表明,将 CNN 与迁移学习、数据增强和 SENet相结合的技术提高了牲畜图像分类的性能,是卷积神经网络在农场自动化分群中的有效应用。关键词:深度学习;卷积神经网络;数据增强;迁移学习中图分类号:TP183 文献标志码:A DOI:10.16157/j.issn.0258-7998.223297中文引用格式:杨诒斌,王俊强,柴世豪.基于 CNN 的智慧农场图像分类方法J.电子技术应用,2023,49(4):33-38.英文引用格式:Ya
3、ng Yibin,Wang Junqiang,Chai Shihao.Image classification of intelligent farm based on convolutional neural networkJ.Application of Electronic Technique,2023,49(4):33-38.Image classification of intelligent farm based on convolutional neural networkYang Yibin1,2,Wang Junqiang1,2,Chai Shihao1(1.School o
4、f Instrumentation and Electronics,North China University,Taiyuan 030051,China;2.Institute of Frontier Interdisciplinary Sciences,North China University,Taiyuan 030051,China)Abstract:In order to solve the problem of perception and no decision-making in the agricultural modernization of Xinjiang Corps
5、,an image classification method(TL-DA-SE-CNN)based on attention mechanism module(SENet)and convolutional neural network hybrid model transfer learning is proposed.This method selects four different CNN models for weight acquisition,including VGGNet,ResNet,InceptionNet and MobileNet.The model uses th
6、e SENet classifier instead of the fully connected layer of the convolutional neural network,extracts the structural high-order statistical features of the image for topic classification,and uses the BP algorithm to adjust the parameters,with a classification accuracy of 98.20%.Experimental results s
7、how that the technology of combining CNN with transfer learning,data augmentation and SENet improves the performance of livestock image classification,which is an effective application of convolutional neural network in farm automation clustering.Key words:deep learning;convolutional neural network;
8、data enhancement;the migration study0 引言卷积神经网络和迁移学习或数据增强已被应用于自动可靠地对农场果蔬图像进行识别与定位1。赵立新2等人也将这些方法应用于农业生产中农作物病虫害识别技术,以提高分类精度3。目前,SENet4也广泛应用于多个领域。刘学平5等在基于 YOLOv3 模型的特征提取中加入了 SENet,改良了传统 YOLOv3 将图像背景识别为工件的情况6,模型查全率得到有效提升。蔡伟龙7等提出了一种将 SENet 和多头自注意力相结合的关系抽取模型,对卷积通道进行注意力加权机制以解决远程监督的噪声,检测速度和准确性获得了很大的提高。本文介绍了一
9、种新的混合模型,该模型将 CNN 与SENet 分类器相结合,采用迁移学习和数据增强以优化性能,同时降低训练数据要求。经过比较实验,混合模型将 MobileNet 与 SENet 相结合,前者在 4 个 CNN 中具有最高的分类准确性。实验表明,所提技术对农场物种的分类性能良好。1 方法1.1 创建数据集使用 Python 脚本从网络上爬取一系列共 10 800 张牲畜图像用作神经网络的输入8。数据包括 4 种不同类*基金项目:新疆政法学院校长基金项目(XZZK2021006)33Artificial Intelligence人工智能www.ChinaAET.com型的标签:鸡、马、牛和羊,图
10、 1 提供了每种类型的示例。将图像数据集按比例分为 3 组,其中 6 800 张图像用于训练,2 000 张图像用于参数验证,2 000 张图像用于测试模型的性能9。表 1 列出了每种牲畜类型的可用图像数量。由于每种牲畜类型的图像数量不同,因此有必要使用这些比例划分牲畜类别,3 个分割的数据集存储在具有路径和标签的不同文件中。1.2 卷积神经网络卷积神经网络(CNN)10是一种在计算机视觉中常用的 深 度 学 习 模 型,包 括 卷 积 层、池 化 层 和 全 连 接 层。CNN 的运行方式与标准神经网络非常相似。它的特殊之处,在于 CNN 层中的每个单元是高维滤波器,其与该层输入进行卷积运算
11、。卷积运算使得 CNN 学习到的模式更加贴合人眼视觉,具有平移不变性和特征的空间层级结构,这使得 CNN 仅需要更少的样本就可以学到具有泛化能力的数据表示。选择 4 种类型的 CNN 结构进行模型训练,包括 VGGNet、ResNet11、InceptionNet12和 MobileNet13。1.3 优化1.3.1 数据增强理论上当数据集无穷大,CNN 就永远不会过拟合,增加训练样本是优化模型最简单有效的方式。但是,数据收集可能成本过高,并且十分耗时。因此,当训练样本数量相对较少时,可以采用数据增强的方式扩大数据集。通过使用旋转、裁剪、翻转、缩放、平移和剪切等操作,从现有训练集图像制作出多个
12、副本来执行数据增强,以允许对大规模模型进行更强大的训练。该过程的结果如图 2 所示。1.3.2 迁移学习迁移学习14是将在相关任务中获得的知识应用于当前任务的优化中,从而可以使用从其他数据集获取的特征来训练和微调分类模型。如果这个原始数据集足够大且足够通用,那么迁移学习网络学到的特征的空间层次结构可以有效地作为视觉世界地通用模型,用于处理不同分类任务。本文所提出的算法包括迁移学习,用以补偿有限的训练样本。ImageNet 是一个包含图片的大型数据集,在以前的研究中已被用于训练经典 CNN,实现了良好的特征提取和分类性能。因此,本文使用 ImageNet 对模型进行了预训练,并对相应的参数进行微
13、调,以确定它们对分类性能的影响。1.3.3 MobileNetMobileNet 的基本单元是深度可分离卷积(Depthwise Separable Convolution,DSC)15,其 改 进 之 处 在 于使用分步卷积替代传统卷积,减少了卷积核的冗余表达,大幅度降低了计算量。在输入与输出图像尺寸一致的情况下,如果采用 DK DK尺寸的卷积核,则传统卷积的计算量 C1 是:C1=DK DK M N DF DF(1)其中,DF 表示输入与输出特征图的宽度与高度,M 表示输入特征图的通道数,N 表示输出特征图的通道数,DK 表示卷积核的长和宽。相比之下,深度可分离卷积的总计算量 C2为:C2
14、=DK DK M DF DF+M N DF DF(2)将两者的乘法计算量相对比:DK DK M DF DF+M N DF DFDK DK M N DF DF=1N+19(3)从式(3)可得,深度可分离卷积与传统卷积计算量的比 值 为1N+19。MobileNet 作 为 基 础 网 络 提 取 图 片 特征,可以在尽可能保证性能的情况下极大地减少运算量,因此该网络非常适用于生产应用。1.3.4 SENet 模块SENet(Squeeze-and-Excitation block)是一个轻量型的注意力机制模块,如图 3 所示。它的中心思想是:对图 1牲畜图像样本表 1牲畜类型数量牲畜类型鸡马牛羊
15、图像标签0123图像数量3 0003 0002 4002 400图 2数据增强的示例34Artificial Intelligence人工智能电子技术应用 2023年 第49卷 第4期于每个输出通道(channel),预测一个常数权重对其进行加权计算。图 3 中,对 于 任 意 给 定 的 变 换:Ftr:X U,X RH W C,U RH W C,Ftr在这里用作一个卷积算子。特征 U通过压缩(Squeeze)操作,将跨空间维度H W的 特 征 映 射 进 行 聚 合,生 成 一 个 通 道 描 述 符H W C 1 1 C,将全局空间信息压缩到上述通道描述符中,使来这些通道描述符可以被其输
16、入的层利用,公式如下:zc=Fsq(uc)=1H Wi=1Hj=1Wuc(i,j)(4)通道描述符通过自选门机制(Excitation)学习样本的特征激活,使模型获取样本的全局信息,设定权重保留有效特征、抑制无效特征,为了得到特征权重信息,需要进行卷积操作。公式如下:s=Fex(z,W)=(g(z,W)=(W2(W1z)(5)其中,代表 sigmoid,代表 ReLU。将 Excitation 输出的权重通过乘法逐通道加权到输入特征上,公式如下:X=Fscale(u,s)=s u(6)SENet 可以很方便地集成到现有网络中,如 InceptionNet、Inception-ResNet、ResNet、ResNeXt 都能有所提升,适用范围很广,结果提升很大,并且代价很小。本文将其与 MobileNet 相结合,进一步提高了原始网络模型的精度和其他性能。1.3.5 改进型 MobileNet+SENetMobileNet 与迁移学习和数据增强相结合,实现了更高的分类准确性。为了进一步提高分类性能,利用CNN 模型将图像数据转换为特征向量,并添加 SENet 注意力机制模块。然后选择最后