1、第 46 卷 第 1 期2023 年 1 月测绘与空间地理信息GEOMATICS&SPATIAL INFORMATION TECHNOLOGYVol.46,No.1Jan.,2023收稿日期:2022-01-17作者简介:齐建伟(1983-),男,河南开封人,讲师,硕士,2009 年毕业于中国矿业大学大地测量学与测量工程专业,主要从事无人机测绘、3S 技术应用方面的教学研究工作。基于 U-Net+的烟草种植信息提取齐建伟(黄河水利职业技术学院,河南 开封 475004)摘要:以洛宁县为研究区,高分二号为数据源,利用 U-Net+模型对研究区烟草进行提取。结果表明:基于 U-Net+模型烟草提取
2、的准确率、F1 分数和 Kappa 系数相比于原始的 U-Net 模型提取精度分别从 86.33%、73.86%和 0.65 提高到 91.85%、80.13%和 0.82。综上可知,本文提出的 U-Net+网络模型在烟草提取中是可行的,为烟草信息的快速提取提供了技术支持。关键词:深度学习;语义分割;烟草;信息提取;高分二号中图分类号:P228 文献标识码:A 文章编号:1672-5867(2023)01-0100-03Tobacco Planting Information Extraction Based on U-Net+QI Jianwei(Yellow River Conservan
3、cy Technical Institute,Kaifeng 475004,China)Abstract:This paper takes Luoning county as the study area and GF-2 satellite images as the data source,and uses U-Net+model to extract tobacco in the study area.The results showed that the accuracy,F1 score and kappa coefficient of tobacco extraction base
4、d on U-Net+model were improved from 86.33%,73.86%and 0.65 to 91.85%,80.13%and 0.82 respectively as compared with o-riginal U-Net model.To sum up,the U-Net+network model proposed in this paper is feasible in tobacco extraction,and provides technical support for the rapid extraction of tobacco informa
5、tion.Key words:deep learning;semantic segmentation;tobacco;information extraction;GF-20 引 言烟草是中国重要的经济作物,烟草种植信息在生产管理过程中有着重要的作用,关系到政府的宏观调控和政策决议1-2。中国烟草生产和消费在世界上占有重要地位,但由于中国土地广阔,每个地区的地形条件又不同,这给烟草的精确监测带来巨大的困难。尤其在山区,烟草种植地块破碎、地物特征相似程度高,这就使得传统的烟草监测方法不再适用,并且很难实现对烟草的实时监测。近些年,遥感技术有着跨越式的发展,因其监测范围大、快速成像和多波段的特点,
6、被广泛地应用于作物监测中3-5,实地调查能够确保很高的精度,但是需要大量的人力和时间。近代遥感技术的出现,促使研究人员尝试将遥感技术应用于农业中,即农业遥感6。卫星影像提供了高分辨率的同时还具有很大的覆盖面积,M.RuB-wurm 等利用 Sentinel-2A 卫星数据对德国慕尼黑的主要农作物进行分类,准确度达到 76.2%7;石娴等8利用NDVI、EVI 作为构造时序影像的特征,并通过随机森林对地块进行分类,取得了很好的效果;雷春苗等9利用随机森林、支持向量机、BP 神经网络、Softmax 和最大似然分类器对柴达木地区的枸杞进行提取,都取得了不错的效果。刘芸等10基于面向对象的思想,根据
7、烤烟的纹理、光谱等特征,提取烤烟种植信息,总体精度达 91%。随着科学技术的发展和研究的不断深入,以及深度学习快速发展,越来越多的研究者利用深度学习对农作物进行分类。陈诗扬等11利用 6 个深度学习模型在农作物制图工作中进行评估,为深度学习在农业遥感中的应用提供参考。伊尔潘艾尼瓦尔等12采用 U-Net 深度学习方法,借助 U-Net 网络多重卷积运算的特点充分挖掘棉花在遥感影像上的深层次特征,从而提高棉花的提取精度。周欣昕等13提出一种基于特征分离机制的深度学习语义分割网络植被提取方法,完成了遥感影像植被信息提取并取得很好的精度。洛宁县生态环境良好,非常适合烟草生长,在洛阳市烟草种植中处于领
8、先地位,作为当地的基础产业,烟草种植也是当地人民脱贫致富的重要途径之一。政府决策部门迫切需要及时、准确地掌握烟草种植的分布和面积14。1 试验区与数据处理1.1 研究区概况研究区兴华镇隶属河南省洛阳市洛宁县,位于洛宁县西南部,伏牛山腹地,地域面积 187.5 km2,属温带大陆性季风 气 候,气 候 温 和、日 照 充 足。多 年 平 均 气 温13.7,多年平均日照 2 217 h,年平均降水 600 mm,适宜烟草种植。1.2 数据来源及预处理根据烟草及当地主要农作物的物候期,选择 2020 年7 月 7 日拍摄的两景高分二号卫星影像,数据通过中国资源卫星应用中心获得,高分二号卫星搭载 2
9、 台高分辨率1 m 全色、4 m 多光谱相机,具有亚米级空间分辨率。为了更好地利用卫星影像数据,我们需要对其进行预处理,预处理过程包括辐射定标、大气校正、正射校正和影像融合等操作。最后得到空间分辨率为 1 m,由红、绿、蓝和近红外 4 个波段组成的融合图像。1.3 数据集制作通过实地勘测和人工目视相结合的方法,获取一定数量的真实的烟草地块矢量。利用 ArcGIS 软件勾画烟草地块,生成和原始影像相对应的标签图像,再通过 Python软件,将原始影像和标签影像随机裁剪成 256256 的小块,用于模型训练。因网络上并没有公开的烟草数据集,自己制作的数据集又偏少,因此,通过数据增强的方式对数据集进
10、行扩充,原本的 400 张图片经过水平翻转、垂直翻转、对角翻转扩充到 1 600 张,并按 82的比例随机划分为训练集和验证集。2 网络结构2.1 U-Net 结构U-Net 是比较早使用全卷积网络进行语义分割的算法之一,最开始主要应用于医学影像的分割上。之后,大量的学者进行研究,U-Net 被慢慢地应用到卫星等遥感影像中。ChenYan 等使用与 U-Net 结构相似的网络,对研究区的小麦进行分割,并取得了不错的效果15。U-Net 网络结构如图 1 所示,它主要由主干特征提取部分、加强特征提取部分和预测部分 3 个部分组成。主干提取部分可以看作是网络的编码层,是一种典型的卷积网路结构,每层
11、由 2 个 33 的卷积层和 1 个池化层组成,利用编码层进行下采样,最终获得 5 个有效特征层。加强特征提取网络就是网络解码的过程,每一层都使用 22的卷积核进行反卷积操作,通过上采样将获得的特征层进行特征融合。经过 4 层编码层和 4 个解码层处理后,把最后一层输出到 11 卷积核、激活函数为 softmax 或 sig-moid 的卷积层进行卷积运算,将特征向量映射到网络的输出层完成图像的逐像素分类。本文主要是进行烟草提取,属于二分类任务,因此,激活函数选择 sigmoid15。2.2 U-Net+网络U-net 原论文中下采样卷积层为 4 层,对于一些简单图 1 U-Net 网络结构F
12、ig.1 U-Net network structure的特征如边界、颜色等,我们可以通过浅层卷积神经网络进行图像的特征提取,而一些深层的更加抽象的空间特征,需要通过深层卷积网络扩大感受野的方式进行提取。但是,U-Net 网络结构层次并不是越深越好,因为不同层次特征的重要性对于不同的数据集是不一样的,因此,在影像分割任务中,很难找到一个固定层次的 U-net 网络对所有数据集都可以得到最优解,故针对以上问题对 U-Net进行改进。改进后的 U-Net+网络如图2 所示,它通过嵌入不同深度的 U-Net 网络,使其共享编码器,在解码部分设置跳跃连接,通过设置的跳跃连接在节点处得到不同的特征图,使
13、聚合层可以决定如何将跳跃连接中携带的各种特征图与解码器特征图融合在一起。它的好处在于在进行深度监督训练网络时,不需要过于关注网络的深度,这是因为它可以同时训练所有的 U-Net,使网络可以自动抓取不同层次的特征,以实现高灵敏的特征提取。图 2 U-Net+网络结构Fig.2 U-Net+network structure3 实验流程3.1 实验环境实验的硬 件 CPU 为 英 特 尔 Xeon E5-1620v4 3.20 GHz,GPU 为 NVIDIA Quadro M2000,TensorFlow 后端的 Keras 深度学习框架实现 U-Net 模型的搭建。3.2 模型训练安装调试好网
14、络环境,把网络的输入尺寸设置为 2562564,将制作的数据集按 82的比例划分为训练集和验证集,初始学习率设置为 5e-4,batch-size 设置为 2,并设置学习率迭代次数衰减,当 3 个 epoch 过去而 val_loss 不下降时,学习率减半。设置回调函数,val_loss 连续 10 轮都没有出现下降训练就停止。模型训练时,根据设置batch-size 的大小将训练集送入道网络进行训练,因实验电脑配置较低,一次输入 2 张图像,设置迭代次数 50 次。101第 1 期齐建伟:基于 U-Net+的烟草种植信息提取训练过程使用的优化器为 Adam(Adaptive Moment E
15、stimation),是一种随机梯度下降法的扩展。它和传统的随机梯度下降法有一定的不同,随机梯度下降保持单一的学习速率,对所有的权重进行更新,而且在训练过程中,学习率并不会下降,每一个参数都保持一个学习率,在学习进行过程中,单独地进行调整优化,该方法从第一次和第二次矩的预算去计算不同参数的学习速率。3.3 模型预测因为研究区的范围比较大,如果我们直接将图像输入到网络中,会造成内存的溢出,使用常规的规则格网裁剪后再预测的话,拼接起来的效果不是很好,因为每张图像块的边缘区域的上下文信息较少,导致预测精度很低,进而还会出现明显的拼接痕迹。因此,我们这里使用忽略边缘(划窗)预测,即有重叠地裁剪影像并在
16、拼接时采取忽略边缘的策略,如图 3 所示,实际裁剪图像预测的结果是 A,进行拼接时的结果为 a,a 占 A 的区域百分比为 r,相邻裁剪图像的重叠度比例为 1-r。图 3 忽略边缘预测示意图Fig.3 Ignoring edge prediction diagram4 结果分析分别利用 U-Net 网络和 U-Net+网络对模型进行训练,并对研究区进行预测,提取烟草地块,白色区域代表烟草。结果如图 4 所示。图 4 研究区预测结果对比图Fig.4 Comparison of prediction results in the study area通过真实的烟草地块图像分别和各个模型预测结果构建混淆矩阵并进行精度评价,精度对比见表 1。表 1 精度评价表Tab.1 Accuracy evaluation tableModel准确率(Precision)F1 分数Kappa 系数U-Net86.33%73.86%0.65U-Net+91.85%80.13%0.82 从表1 可以看出,本文提出的 U-Net+模型相比于原始的 U-Net 网络,准确率提升了 5.52%。F1 指数和 Kap-