1、测绘通报2023 年第 6 期引文格式:王丽梅,王延正 基于高分辨率遥感影像的建筑物提取J 测绘通报,2023(6):180-183 DOI:10 13474/j cnki 11-2246 2023 0191基于高分辨率遥感影像的建筑物提取王丽梅1,2,王延正3(1 河北省水文工程地质勘查院(河北省遥感中心),河北 石家庄 050021;2 河北省遥感中心,河北 石家庄 050021;3 北京图源科技有限公司,北京 100192)摘要:高分辨率遥感影像不仅具有丰富的光谱、空间分布、形状和纹理特征,也包含清晰的场景语义信息。本文以安徽省枞阳县枞阳镇为研究区域,以高分辨率影像为基础数据源,利用 e
2、Cognition 软件中深度学习与面向对象相结合的方法进行建筑物自动提取。结果表明,该方法具有更好的建筑物提取效果,总体分类精度达 96.8%,可用于通过高分辨率影像进行建筑物提取的生产。关键词:深度学习;eCognition;多尺度分割;面向对象影像分析;卷积神经网络中图分类号:P237文献标识码:A文章编号:0494-0911(2023)06-0180-04Buildings extraction based on high-resolution remote sensing imageryWANG Limei1,2,WANG Yanzheng3(1 Hydrology Engineer
3、ing Geological Exploration Institute of Hebei Province,Shijiazhuang 050021,China;2 Hebei Provincial Remote SensingCenter,Shijiazhuang 050021,China;3 Beijing MapCore Technology Co,Ltd,Beijing 100192,China)Abstract:High-resolution remote sensing images not only have rich spectrum,spatial distribution,
4、shape and texture features,but alsocontain clear scene semantic information Taking Zongyang town,Zongyang county,Anhui province as the research area,and usinghigh-resolution images as the basic data source,the deep learning and object-oriented method in eCognition software is used toautomatically ex
5、tract buildings in this paper The results show that the method of combining deep learning with object-oriented has abetter effect of building extraction,and the overall classification accuracy reaches 96.8%,which can be used for building extractionproduction based on high-resolution imagesKey words:
6、deep learning;eCognition;multiresolution segmentation;object-based image analysis;convolutional neural networks随着遥感技术的进步,遥感影像的分辨率已达到分米级,影像上的地物信息更加丰富,各种地物在影像上显示更加清晰。遥感影像已被广泛应用于新型基础测绘、数字城市建设、自然资源动态监测、突发事件实时监测调查、军事侦察、灾情调查、生态保护及环境治理调查等各个领域。建筑物作为主要的地物特征之一,是高分辨率遥感影像上的重要内容。研究高分辨率遥感影像上建筑物的自动化、高精度提取对于卫片执法、城市
7、规划、智慧城市建设等各种应用具有重大的现实意义。建筑物提取是遥感信息处理与分析、计算机视觉和人工智能等领域的重要研究内容。基于面向对象影像分析(object-based image analysis,OBIA)的方法是利用光谱、形状、纹理等多个特征提取建筑物,再根据一定的条件对结果进行归并和后处理,最终生成建筑物提取结果。文献 1提出了一种高分辨率遥感影像城区建筑物自动提取方法。该方法将遥感影像中的光谱特征与视差影像中的三维信息相结合,对规则城市建筑物进行自动检测,准确率高。文献 2基于高分辨率可见光遥感图像,在多尺度分割的基础上,根据多尺度结构信息、光谱特征、空间组合规则信息等从特征基元中自
8、动选取样本,并计算其特征,在建筑区域内提取房屋的外部轮廓,该方法具有较高的识别率。由于土地覆盖类型的多样性,采用面向对象分类方法进行建筑物提取具有挑战性。一方面,各种建筑物的屋顶可能具有不同的材料;另一方面,道路和建筑物等不同的特征可能具有相似的特征。此外,还需考虑遮挡和阴影的影响,因此存在提取的建筑物边界模糊、不完整,以及提取精度较低等问题。深度学习是模拟人脑的学习过程,在输入影像数据低层特征中自动提取高层次特征。随着深度学习的快速普 及 与 发 展,出 现 了 许 多 以 卷 积 神 经 网 络(convolutional neural networks,CNN)为基础的网络模型3,在遥感
9、影像的信息提取中取得了良好的效果。文献 4比较了 4 种先进的卷积神经网络,对081收稿日期:2023-03-16;修回日期:2023-04-19作者简介:王丽梅(1980),女,高级工程师,主要从事空间地理信息与地图制图工作。E-mail:420545734 qq com2023 年第 6 期王丽梅,等:基于高分辨率遥感影像的建筑物提取56 km2范围内的建筑物进行提取,并取得了较好的效果。文献 59将卷积神经网络算法应用于建筑物提取,精度有明显提高,但需要大量样本。针对上述高分辨率遥感影像建筑物信息提取现存的问题,本文提出将深度学习与面向对象集成的高分辨率遥感影像建筑物提取方法,并对其进行
10、精度分析与评估。1研究区概况本文试验测试数据为高分 2 号遥感影像,其全色分辨率为 1 m,多光谱影像的分辨率为 4 m,包括蓝、绿、红、近红外 4 个波段,成像时间为 2019-06-18。将原始高分 2 号影像进行融合、校正处理后,生成 1 m 分辨率的 RGB 真彩色影像。研究区域位于安徽省枞阳县枞阳镇,位于沿湖丘陵地区,多为单体建筑类型,也有少量棚房、平房。如图 1 所示。图 1研究区真彩色遥感影像数据2研究方法与过程CNN 由传统神经网络10 发展而来,是一种快速使用的深度学习神经网络算法,主要用于图像分类11-13,在 2012 年 AlexNet 发 布 并 以 GoogleTe
11、nsorFlow 为实现平台后开始流行14。CNN 包括输入层、隐藏层、输出层。隐藏层是卷积神经网络的重要组成部分。CNN 向前传播可得出输出值,反向传播则可调节偏置和权值。其整体架构可分为特征提取和分类两个主要部分14。特征提取或特征学习部分由卷积层和池化层组成,而分类部分由全连接层组成(如图 2 所示)。训练数据集越大,CNN 的性能越好。选择 eCognition v10.3 软件作为技术平台开展建筑物提取研究,eCognition15 是全球所有商用遥感解译软件中第一 款面向对象影像分析的软件。eCognition 软件可基于研究区中地物特征分布具有代表性的部分区域创建规则集,然后将规
12、则集应用于整个研究区,对大面积的研究区采用批处理的方式,进而提高工作效率。本文使用 eCognition 软件中的卷积神经网络与面向对象相结合的方法对建筑物进行分类提取。大致流程为:首先以覆盖研究区域的 2018 年同时相 1 m 分辨率真彩色影像和基于该影像提取的建筑物矢量数据作为参考资料,通过 2018 与 2019 年的影像创建样本库;然后通过卷积神经网络的方法对 2019 年的影像进行建筑物热度图像的创建;最后在热度图像基础上,通过面向对象影像分析的方法进行建筑物提取与提取结果优化。具体流程如图 3 所示。图 2CNN 总体架构图 3本文方法具体流程2.1基于卷积神经网络的建筑物提取e
13、Cognition 软件中具有完整的卷积神经网络工作流程,包括采集与管理样本、创建模型、训练模型、应用模型及管理模型,如图 4 所示。2.1.1样本创建将 2018 年参考矢量数据转为点文件,然后通过eCognition 软件中集成的基于矢量创建样本的算法进行样本包创建。标记样本考虑不同的参数创建,181测绘通报2023 年第 6 期包括样本数量、样本大小、图像层。本文为建筑物类与非建筑物类共生成 1000 个样本,通过试错法确定最佳样本大小为 3232 像素。样本量小于最佳样本量,会引入多个建筑物检测错误,而样本量较大则无法检测到较小的建筑物。图 4eCognition 软件中卷积神经网络流
14、程2.1.2创建模型CNN 模型由两个隐藏层创建。输入图像大小与样本相同。隐藏层基于内核大小、特征图数量和最大池化。由于偶数大小的内核将生成于像素之间的隐藏单元,移动以匹配像素边界,原始大小的内核(77)被分配了 12 个特征图。使用 22 过滤器的最大池化,在水平和垂直方向的步幅均为 2,用于降低特征图的分辨率。因此,37712 的权重对应隐藏层内核。第 1 个因子(3)表示图像层的数量,第 2 个和第 3 个因子(77)描述局部邻域中的单元数,连接从这些单元转发到隐藏层。最后一个因素(12)表示生成的特征图的数量。2.1.3训练模型CNN 模型基于标记样本进行训练,并使用反向传播调整模型权
15、重。0.000 6 的学习速率是根据试错法分配的。该参数定义了在统计梯度下降优化的每次迭代中调整权重的量。学习率的值越高,训练速度越快,但可能达不到最优最小值的底部。虽然较小的值会减小训练处理速度,且可能会卡在局部最小值并最终导致权重甚至不接近最佳设置。本文共设置 5000 个训练步长,每个训练步使用50 个训练样本。2.1.4应用模型将经过训练的 CNN 模型应用于 2019 年 1 m 分辨率的 RGB 真彩色影像,生成建筑物类的热度图像,如图 5 所示。该图显示了具有相应概率值的建筑物的可能性。使用 77 高斯滤波器对热度图像进行平滑处理,并使用 33 像素的形态(扩张)滤波器生成建筑物
16、平滑热度图的局部最大值。阈值设置为 0.55,大于该阈值均为建筑物。图 5执行 CNN 模型生成的建筑物热度图像2.2基于面向对象的建筑物提取优化在基于深度学习分类提取建筑物的基础上,将前期创建的建筑物热度图像与真彩色影像采用多尺度分割算法进行分割,经试错分析,确定分割尺度为 50,紧致度为 0.5,形状为 0.1。分割后的影像中,每一个对象都具有独特的光谱信息、几何形状特征、纹理特征、空间位置特征。利用 eCognition 中的 Brightness、Density、Shape index、Rectangular fit 等特征,通过多次试验,选择合适的阈值,对提取的建筑物进行分类细化,然后通过基于像素的对象重塑算法(增长、收缩)对建筑物边界进行优化,并分类合并,移除面积较小的建筑图斑(小于 10 个像素),最终输出建筑物成果。基于深度学习提取的建筑物如图 6 所示,基于面向对象分类优化后的建筑物如图 7 所示。图 6基于深度学习提取的建筑物图 7基于面向对象分类优化后提取的建筑物2.3建筑物分类精度评估将建筑物验证样本导入 eCognition 软件,通过精度评估工具进行建筑物分