1、2023 年 4 期智慧农业导刊Journal of Smart Agriculture智慧农业基金项目:国家自然科学基金(32001910);国家级大学生创新创业训练计划项目(202110356040);浙江省基础公益研究计划项目(LGN20C140005)*通信作者:潘铖(1989-),男,博士,讲师。研究方向为农业害虫防治。深度学习在农业病虫害智能识别方面的研究进展宋仕月1,陈政羽2,郑一凡1,徐梓航2,潘铖1*(1.中国计量大学 生命科学学院,杭州 310018;2.中国计量大学 信息工程学院,杭州 310018)中国作为一个农业大国,农作物因其品种庞杂,在培育过程中会受到不同类型有害
2、微生物和害虫的侵袭1,导致农作物在产量和质量上会有不同程度的损失,严重时甚至会导致农作物大范围绝收、绝产。近些年,由于各类农产品广泛出口,国内农产品市场不断扩大,出口额节节攀升,经济占额比快速提升。但是经济社会不断发展的同时新问题也层出不穷,各类病害的发生和真菌的变异影响了人们的生产、生活,农作物发病率越来越高,极大影响了我国农业经济的发展,影响了农产人员的生活。因此,研究农作物病虫害的预防以及诊断、治疗和补救措施显得尤为重要。植保专家和相关技术人员因人员数量有限,无法满足中国广大农民的需求;有经验的农民因其视觉系统存在局限性、模糊性和主观性等缺点,可能导致误判、错判;农民进行诊断时,在查阅相
3、关资料、寻求专家援助过程中,不仅会很大程度浪费时间,甚至还会贻误对作物进行最佳防治、补救的时间。因此针对上述问题,运用现代信息技术,寻找一种合适的方法对植物病虫害进行高效、准确识别和防治具有重要意义。深度学习持续创新发展,其研究价值和潜力不断被人们挖掘,基于在图像识别领域中的优势,成为当下推动农业向着精准化、智能化发展的新兴动力。据大数据显示,围绕农田中作物病虫害的识别和预测系统、模型、APP 及其研究都还在起步阶段2。本实验项目以大田作物病害识别研究图像数据集为基础,基于深度学习方法构建茶树病虫害智能化识别系统,改造传统病虫害诊断模式,使其最终能够部分替代专业人员诊断,从而提高病虫害监测预警
4、和科学防治水平。1深度学习深度学习实质上是通过添加多种算法,建立多样化的模型来对人类神经系统进行模拟,然后通过海量数据对构建的多层隐藏层进行训练,对图像抽象特征摘要:深度学习(Deep Learning,DL)附属于机器学习算法的一个分支,实质是一种通过海量数据对构建的多层隐藏层进行训练,使其习得一种更有意义的抽象特征,从而提高分类及预测准确性的算法,其是通过模拟人脑的深层神经结构来学习和表达文本、图像、声音和动作等数据。近些年来深度学习已经广泛应用于智慧农业各类病虫害。该文首先详细介绍深度学习,其次以深度学习在茶树病虫害智能识别方面的具体进展及研究为例进行介绍,最后在查阅相关文献的基础上讨论
5、分析,得出进一步的结论。通过对相关研究的系统综述,以深度学习为基础深入探索农业病虫害智能识别的研究。关键词:深度学习;病虫害;智能识别;神经网络;研究进展中图分类号:S43文献标志码:A文章编号:2096-9902(2023)04-0001-04Abstract:Deep Learning(DL),which is attached to a branch of machine learning algorithm,is essentially an algorithm thattrains multi-layer hidden layers through massive data to a
6、cquire a more meaningful abstract feature,so as to improve the accuracyof classification and prediction.It learns and expresses text,image,sound and action data by simulating the deep neural structure ofthe human brain.In recent years,Deep Learning has been widely used in all kinds of diseases and i
7、nsect pests in smart agricul-ture.This paper will introduce Deep Learning in detail,and then take the specific progress and research of Deep Learning in intel-ligent identification of tea diseases and insect pests as an example,and finally discuss and analyze it on the basis of consulting rel-evant
8、literature,and draw further conclusions.Through a systematic review of related research,this paper explores the intelligent i-dentification of agricultural diseases and insect pests on the basis of Deep Learning.Keywords:Deep Learning;diseases and insect pests;intelligent recognition;neural network;
9、research progressD O I:1 0.2 0 0 2 8/j.z h n y d k.2 0 2 3.0 4.0 0 11-2023 年 4 期智慧农业智慧农业导刊Journal of Smart Agriculture进行提取并分类整合,从而提高分类及预测准确性的算法。深度学习以其优越的表现及前景在机器学习中脱颖而出,发展成为一个新的分支,对推动人工智能的发展具有重要意义。1.1深度学习起源深度学习的概念源自人工神经网络。在最开始的研究中,由于感知机对非线性问题无法进行处理,神经网络研究发展陷入低谷期。2006 年,由 Hinton 等在Science 发表的文章中提出,深度
10、学习正式出现在大众的视野中。深度学习是模拟类似于人脑深层的神经网络来实现多种数据拟合的一类机器学习方法,运用多层次的图像空间位点特征学习,形成一种树状的操控模式,进行深层次鉴别。深度学习的过程可以视为由底层到高层,通过逐层加工输入信号,从而将与输出目标联系不紧密原始的输入表示转换成与输出目标紧密联系的表示特征学习过程,这种自下而上的信息分层处理方式,有利于获取更抽象、更少歧义和更具鲁棒性的特征。深度模型处理问题的能力依赖于其模型的复杂度,通过增加隐层神经元的数目提升模型的复杂度,且增加的层次越多准确性越好,大幅提升模型的性能。1.2深度神经网络典型的深度学习模型通过逐步将低层神经元累加组合成便
11、于区分的高层抽象表示,构成一种深层的神经网络。“神经元”是其基本构成单位。深层神经网络一般可被区分为 3 大类。1)对数据的高阶相关特性进行描述生成的深层结构。2)描述数据的后验分布的判别深层结构。3)结合了上述 2 种结构的混合深层结构。深度神经网络学习方法也分为 3 类:监督学习、无监督学习和混合学习。其中监督学习模型主要有 MLP(多层感知器)、CNN(卷积神经网络)等类型,无监督学习模型主要有DBN(深度置信网络)、自动编码器等类型。混合学习模型是利用无监督学习来生成深度结构,由监督学习进行微调。1.3深度学习框架深度学习框架是进行深度学习相关领域研究的工具集。目前普遍流行的深度学习框
12、架有:Theano、Caffe、Torch、TensorFlow、Keras、CNTK、MXNet、PaddlePaddle 和 PyTorch 等3-8(表 1)。框架名称 开源面世时间 开发者 支持语言 Theano 20l2 年以前 蒙特利尔大学(Universite de Montrea)Python Caffe 20l3 年底 伯克利视觉学习中心 BVLC Python/C+Torch 20l4 年 脸谱网(Facebook)Python/C+TensorFlow 20l5 年 谷歌(Google)Python/C+/Java/Go/R/Swift/C#/JavaScriPt Ker
13、as 20l5 年 谷歌 AI 研究员(Franois Chollet)Python CNTK 20l6 年初 微软(Microsoft)C+/C#/Python MXNet 20l6 年 阿帕奇(APache)Python/R/Julia/C+/Scala/MATLAB/JavaScriPt Paddle Paddle 20l6 年 百度 Python PyTorch 20l7 年初 脸谱网(Facebook)Python/C+Caffe2 20l7 年 伯克利视觉学习中心 BVLC Python/C+表1当前主流深度学习框架Theano 库是由 MILA 在加拿大魁北克的蒙特利尔大学主导开
14、发。是为了进行高效计算数学表达式符号而被改善出来的一个 Python 库。其经常与 Numpy 库相连接使用,使大规模矩阵运算得到了进一步的优化。Caffe 是 2014 年贾扬清团队开发,由 BAIR 和GitHub 社区贡献者共同维护和支持的一种广泛运用的深度学习框架。Torch 是 Facebook 开发的开源机器学习库、科学计算框架和基于 Lua 编程语言的脚本语言。其提供的深度学习算法,已被多个公司用于解决数据流的硬件问题。TensorFlow 是由 2011 年 Google 内一个机器学习系统 DistBelief 衍生出来的,经过内部优化改进于 2017年 2 月发布了 1.0
15、 版本,TensorFlow 稳定版正式诞生。Keras 是 FrancoisChollet 开发的深度学习和神经网络 API,能够在 TensorFlow、Theano 或 CNTK 之上运行。Keras 是一个为创建深度学习模型提供基础模块,对基础的张量和微分不进行处理的高级模型库。与 TensorFlow 的系统设计过于复杂、学习门槛高不同,Keras学习门槛较低,易掌握,适合快速试验。CNTK 是微软基于深度学习在人工智能领域的研究成果计算网络工具。其发布的 CNTK v2.0 版本,兼容深度学习前端平台 Keras,在准确性和速度方面性能表现极其优秀。2-2023 年 4 期智慧农业
16、导刊Journal of Smart Agriculture智慧农业MXNet 最初是由李沐博士牵头开发,后由 Apache完善的一种分布式深度学习框架。优秀的开发速度、可编程性和可移植性,并对多种编程语言有一定接口,是MXNet 作为深度学习框架被广泛应用的原因。Paddle Paddle 是百度开发的一个易上手、高效率、灵活和可扩展的深度学习平台,其使得研究人员更迅速、简捷地构建深度学习模型,可以较容易地上传训练数据,执行准确、直接和清晰的预测分析,极大提高速度和生产率。PyTorch 是由 FAIR 基于 Torch 推出的一种进阶的深度学习框架。在 2018 年 5 月才正式公布 1.0 版本,并且 PyTorch 0.4 与 Caffe2 合并被应用,主要是被开发用来应对一些在前任数据库 Torch 使用中遇到的问题,同时拓展一些新功能。2深度学习在我国农业中的应用2.1研究的对象与目的目前我国深度学习在农业方面的研究主要集中在可食性农作物物种上,其中包括粮食类,如水稻、小麦和玉米,水果类,如柑橘、苹果和葡萄,蔬菜类,如番茄、黄瓜和花生等物种9-12。对比近些年来,此方面研究