1、第 卷第 期 年 月生态学报 ,:基金项目:国家科技基础资源调查专项资助();国家自然科学基金项目();国家重点研发计划项目()收稿日期:;网络出版日期:通讯作者 :曾纳,任小丽,何洪林,张黎,徐茜,张梦宇,陈秀芝,高超,刘畅三江源国家公园草地地上生物量时空动态及其气候影响生态学报,():,():三江源国家公园草地地上生物量时空动态及其气候影响曾 纳,任小丽,何洪林,张 黎,徐 茜,张梦宇,陈秀芝,高 超,刘 畅,中国科学院地理科学与资源研究所生态网络观测与模拟重点实验室,北京 浙江农林大学环境与资源学院,杭州 国家生态科学数据中心,北京 中国科学院大学,北京 中国科学院大学资源与环境学院,北
2、京 摘要:三江源区位于青藏高原腹地,作为长江、黄河、澜沧江三大河流的发源地,是我国重要的生态安全屏障。基于三江源区域草地 的野外调查数据,本研究采用多种机器学习算法集成分析的方式构建模型,实现了高精度的三江源国家公园草地 时空估算。基于 时空模拟结果,分析了近 年(年)三江源国家公园区域草地 的时空动态变化。研究结果显示:通过多种机器学习结合贝叶斯平均模型,草地 模拟值与实测值的 为,为 ,表明多模型集成分析的方式对草地 估算获得了较好的模拟效果。三江源国家公园区域草地 的空间分布具有明显的空间异质性,呈从东南向西北递减的趋势。年长江源国家公园、黄河源国家公园和澜沧江国家公园区域草地 多年平均
3、值分别为 、和 。近 年间,在黄河和长江源园区受到温度上升的影响草地 呈现出非显著性上升趋势;澜沧江区域,由于 和 年的降水量偏低,年际动态统计结果表现为非显著性下降趋势。关键词:三江源国家公园;草地地上生物量;时空变化;降水敏感性 ,:(),:,(),()()(),()()()(;),;,:;三江源位于青海省南部,是长江、黄河和澜沧江的源头,同时也是重要的草地生态功能区,该区域的生态系统安全问题受到国内外研究人员的广泛关注。年 月,中共中央办公厅、国务院办公厅印发三江源国家公园体制实验试点方案,三江源国家公园成为了我国第一个国家公园体制试点。年 月 日,国务院批复同意设立三江源国家公园,三江
4、源国家公园被列入第一批国家公园名单。三江源处在青藏高原高寒草甸向高寒荒漠区的过渡区域,植被类型以高寒草甸、高寒草原和荒漠草地为主。草地具有固碳释氧、调节气候、水土保持、涵养水源、防风固沙、改良土壤等功能,对生态环境起着举足轻重的作用。另一方面,草地资源也是畜牧业发展的重要物质基础,是全球食品安全保障必不可少的自然资源。三江源作为我国重要的生态屏障,开展区域草地生产力、生物量研究,对于推动三江源国家公园草地的合理利用和科学管理具有重要意义。地上生物量(,)是一定时间内单位面积的植被地上部分的总物质量或干物质量。作为草地生态系统的主要生产力,同时决定着草地的畜牧承载能力。准确地草地 空间估算及其状
5、况评估,是科学合理设定载畜量,有效保护草地资源的重要基础。此外,草地 的时空格局特征与周围环境因素密切相关,通过分析外部环境对草地 的影响,可以更好的理解草地生态系统的变化特征,帮助实现草地资源的科学利用以及可持续发展。地面调查是研究草地生物量的传统方法,一般是在站点进行采样测量得到植被 数据。地面调查法在站点尺度具有较高的精度,但野外数据采集需要大量的人力物力,且对草地有一定的破坏性,不适用区域的草地 研究。区域草地 的估算大多是通过遥感植被指数(,)与 之间的关系,构建统计回归模型,实现 地面调查点的升尺度。这种方法由于其操作便捷、高效的优势,而被广泛应用于各个区域的草地 估算。但由于现有
6、遥感 在理论和技术上的一些不完备性,仅利用单一植被指数构建模型,其模拟精度往往有限。机器学习作为一种更为强大的算法,可以联合多种因子构建经验模型,以获得更高的估算精度。等通过随机森林模型(,)对青藏区的草地 进行了估算,同时与多种回归方法进行了比较,其研究结果表明基于多因子的机器学习模型的精度要优于回归方法。相比传统的回归模型,机器学习模型能够更准确地描述预测变量和目标变量之间的复杂关系,因而更适用于生态系统的研究。随着计算机技术的发展和野外观测数据的积累,各种机器学习算法被应用于不同区域、不同尺度的草地 估算。然而,单个机器学习模型的精度往往受限于它特定的模型结构和计算方式,而采用集生 态
7、学 报 卷:成分析()的方式,在决策级别融合多个机器学习模型的结果,则能有效的整合多模型的优势,得到更为精确和稳健的模型估算结果。多模型结合集成分析技术的模式已被有效的用于一些遥感领域的研究。等采用集成分析的方式融合了多种模型 估算结果,其结果显示集成分析的方式可以有效的融合不同模型的优势,获得更高精度、更稳健的估算结果。为了更好的认识和理解三江源国家公园草地 状况及其变化,以遥感植被指数、气象数据、地形和地理位置数据为模型的备选自变量,草地 实测数据为因变量,本研究在样本点尺度采用多种机器学习结合集成分析的方式构建模型,以实现该区域草地 空间估算。基于近 年(年)的 空间模拟结果,定量分析三
8、江源国家公园草地 的空间格局和年际动态特征。同时,分析三江源国家公园草地 年际变化的温度和降水量敏感性,了解其背后的生态机理,将有助于科学合理的区域草地资源利用和管理。数据与方法 研究区域三江源地处青藏高原腹地,平均海拔在 以上,是长江、黄河、澜沧江的发源地,是我国淡水资源的重要发源地,是高原生物多样性最集中的地区(图)。三江源为典型的高原大陆气候,冷热两季,干湿分明,年均温度差小,年降水量在。由于其独特的地理位置和气候条件,也是亚洲、北半球乃至全球气候变化的敏感区。丰富的自然资源、重要的生态功能使其成为我国重要生态安全屏障。三江源国家公园体制试点区域包括三个园区规划总面积约为 万,包括长江源
9、园区(万)、黄河源园区(万)和澜沧江源园区(万)(图)。三江源国家公园包括治多、杂多、曲麻莱、玛多和唐古拉山的西北部分区域,其覆盖植被以高寒草地为主,约占总面积的。图 三江源国家公园(长江源园区、黄河源园区和澜沧江源园区)地理位置 (,)数据 草地 野外调查数据本研究在三江源区域内共选择了 个草地 野外调查样本点,具体的地理位置分布如图。其来源 期 曾纳 等:三江源国家公园草地地上生物量时空动态及其气候影响:包括:()文献资料和()野外调查采集。野外调查的时间是在每年的生长季,草地生物量达到峰值的时段(约在 月中旬)。每个调查点采用 的样方,在样方内随机选择 个独立的小样方(大小为 )。对 个
10、小样方内的所有植被进行收割,清理后放入 的干燥机中干燥,直到重量保持不变。取三个小样方内植被干重的平均为该样本点的 值。采用极端值剔除法排除样本点中的不合理值,将整个样本点数据中超过均值的标准差的 值剔除。图 草地地上生物量野外调查站点的空间分布 空间数据本研究中草地 模型估算选择的空间数据包括表征地表植被状况的遥感植被指数,以及影响植被生长的气象因素(温度和降水),地形地貌因素(海拔和坡度)和地理位置(经度和纬度)。遥感植被指数采用的 陆地产品第六版,包括 和,空间分辨率为,时间分辨率为 。覆盖三江源区域的影像包括 和,利用影像处理工具 进行拼接,转投影为。为了进一步减少云雨和大气污染的影响
11、,利用 软件使用双 曲线拟合,对 和 进行平滑处理。然后,基于 时间分辨率的 和 数据,计算其生长季均值(分别以 和 表示)用于区域尺度的 估算。气象数据集来自国家生态科学数据中心(:),包括栅格化的 时间分辨率的平均温度和降水量数据,空间分辨率为。进一步计算得到区域的年平均降水量(,)和年平均温度(,)。此外,从地理空间数据云网站(:)下载了数字高程模型()数据(版本,空间分辨率)。对下载的 进行了重新采样到。再基于 数据,通过 软件(,)得到对应区域的坡度数据()。方法 草地 估算方法基于三江源的草地 野外调查数据,通过机器学习算法构建区域草地 估算模型。本研究验证并比较了四种不同的机器学
12、习算法,包括随机森林(,)、规则集回归树()、神经网络(,)和支持向量回归(,)。是 在年所提出的基于决策树的机器学习算法。是由()提出的一种基于规则集的回归树算生 态 学 报 卷:法。不同于 模型的是 的终端(叶)是一个多元回归模型,因而 模型相对 更易于理解,模型效率也较高,适用于大量样本点数据的分类与回归分析。是遥感模型中应用较为广泛的机器学习算法之一,通过模拟人脑的学习过程来构建预测变量和目标变量之间的映射关系。是一种基于统计分析的学习算法,利用核函数将输入数据投影到高维空间中以实现规则分类或目标估算。以草地 观测值为目标变量,本研究将以对应年份和位置的、海拔、经度和纬度值为备选自变量
13、,采用机器学习算法构建草地 估算模型。以备选自变量的所有不同组合来建立模型展开实验,从中选择精度最高的输入变量组合。通过十次交叉()的方式对模型效果进行验证,即每次实验将总样本数据随机分为 份,其中 份(约 个样本点)作为训练样本数据,剩余 份(约 个样本点)作为模型测试数据。重复 次实验,直到每份数据都作为训练和测试数据使用过。然后,基于十次实验的平均相关系数()和均方根误差()对模型效果进行评估。在多种模型模拟精度相当的情况下,采用集成分析()的方式被认为可以有效的融合多种模型的优势,获得更稳健的模拟结果。基于以上四种机器学习得到的草地 模拟结果,本研究将通过贝叶斯集成分析(,)方法融合,
14、以实现更高精度、更稳健的区域草地 模拟。草地 时空敏感性分析先逐像元的对近 年的 区域估算进行了预处理,以剔除了单因子变量的长期变化趋势。如果单因子变量有显著的年际变化趋势,则从年值中减去其线性趋势,没有显著年际变化的则从年值中减去多年均值,得到、和 的年变化量。然后采用多元回归模型,计算草地 年际变化对温度和降水量的敏感性。以 为因变量,和 为自变量,则 和 的回归系数分别表示 年际变异对温度和降水量的敏感性。系数为正则认为该区域 年际变化与温度(或降水量)为正相关关系,系数越大则表明 对温度(或降水量)的变化越敏感。结果与分析 样本数据分析草地 实测值与各要素的相关系数如表 所示。其中,与
15、草地 之间的相关性最高,相关系数()为;与草地 的相关系数为,表明植被指数对草地 具有较好的表征性。在各环境要素中,与草地之间的相关性最高(),表明降水量的空间分布对区域草地空间格局表 草地 及其各环境因子数据的相关分析 地上生物量增强型植被指数生长季均值归一化植被指数生长季均值年平均温度年平均降水量海拔坡度经度纬度地上生物量 增强型植被指数生长季均值 归一化植被指数生长季均值 年平均温度 年平均降水量 海拔 坡度 经度 纬度 :地上生物量 ;:增强型植被指数生长季均值 ;:归一化植被指数生长季均值 ;:年平均温度 ;:年平均降水量 期 曾纳 等:三江源国家公园草地地上生物量时空动态及其气候影
16、响:有较大的影响。各环境因子之间,与 的相关系数为,表明这两种植被指数有较高程度的相似性,但也证明其存在一定的差异性。与 和 的相关系数分别为 和。与经度相关系数为,表明该区域随着经度向东降水量也有所增加。而 与纬度的相关系数为,表明随着纬度的增加区域温度呈现下降趋势。同时,和海拔的相关系数则为,表示随着海拔的上升温度呈下降趋势。模型精度验证四种机器学习模型(、和)取得了可比的结果,训练 值在 之间,测试 值在 之间(表)。在四种 算法中,基于、和 的 模型取得了最好的效果(训练数据集:,;测试数据集:,)。其次是以、和海拔为输入变量的 模型,训练数据集的 为,为 ,测试数据集 为,为。表 草地地上生物量机器学习模型估算效果 模型输入变量 训练数据集 测试数据集()()机器学习模型全部输入 ,和 全部输入,和海拔全部输入,海拔和经度全部输入,和纬度 :随机森林;:人工神经网络;:支持向量回归;:地上生物量;:增强型植被指数生长季均值;:归一化植被指数生长季均值;:年平均温度;:年平均降水量;:均方根误差图 草地地上生物量的集成分析估算值与实测值比较 :为了获得更高精度更稳健的 区域估算