1、第 卷,第期 光谱学与光谱分析 ,年月 ,顾及土壤类型的土壤 含量高光谱遥感反演张霞,王为昊,孙伟超,丁松滔,王一博,中国科学院空天信息创新研究院,北京 中国科学院大学,北京 摘要目前针对土壤重金属的高光谱反演方法大多集中在单一的研究区域或未考虑土壤类型对反演结果的影响,而土壤类型和成土因素的不同会对土壤属性参数的高光谱反演模型的普适性产生一定程度影响。该研究提出一种顾及土壤类型的重金属高光谱遥感反演方法,根据研究区土壤类型,从土壤样本的实验室光谱中提取对重金属起主要吸附作用的土壤光谱活性物质的特征谱段,分别建立基于土壤光谱活性物质特征谱段的重金属含量估算模型。使用改进的遗传算法()对特征谱段
2、进行波段优选,使用偏最小二乘回归算法()建模,使用决定系数()、相对偏差()和预测均方根误差()三个指标对不同的建模方法进行评价。以湖南省郴州市东河流域铅锌矿矿区的黄壤和红壤样本数据为例,采集 个黄壤样本和 个红壤样本,从土壤样本的实验室光谱中提取对 起主要吸附作用的土壤有机质和黏土矿物的特征谱段,均采用 方法进行建模。结果表明:不考虑土壤类型即利用全部土壤样本进行建模时,与全谱段建模结果相比,基于土壤有机质和黏土矿物特征谱段的重金属 含量反演精度的由 提升到 ,由 提升到 ,减少 ;与不考虑土壤类型的建模相比,黄壤样本特征谱段的估算精度由 提升到 ,由 提升到 ,减少 ,红壤样本特征谱段的估
3、算精度由 提升到 ,由 提升到 ,减少 ,黄壤和红壤样本的反演模型均达到了出色模型的标准。因此,土壤光谱活性物质特征谱段的提取以及土壤类型的考虑均有助于提高土壤 含量的反演精度,为应用高光谱遥感图像进行大范围土壤重金属污染监测奠定方法基础。关键词重金属;土壤类型;高光谱遥感;土壤光谱活性物质;特征选择中图分类号:文献标识码:()收稿日期:,修订日期:基金项目:中国科学院战略性先导科技专项课题(),国家自然科学基金项目()资助作者简介:张霞,女,年生,中国科学院空天信息创新研究院研究员 :通讯作者 :引言随着经济的快速发展,各种人为污染源排放所产生的重金属污染 物 通 过 多 种 途 径 进 入
4、 土 壤,造 成 土 壤 重 金 属 污染。是土壤中主要的重金属之一,在土壤中不易降解,迁移性差,会影响土壤性质,妨碍农作物特别是小麦的生长,并最终通过食物链危害人类健康。因此,对 等土壤重金属含量的定量监测意义重大。传统的土壤重金属含量测定方法耗时、费用高、环保性差,无法全面获取数据,而高光谱遥感技术很好的克服了传统方法的不足,为进行土壤重金属的快速无污染检测乃至大范围观测提供了可能。目前对重金属的高光谱反演方法研究大多集中在单一区域或特定的土壤类型。研究发现,影响土壤光谱反射特性的主要因素是土壤的有机质、黏土矿物、氧化铁和水分的含量以及它的质地和母质等,这些影响因素均会随土壤类型的不同而发
5、生变化。徐彬彬等指出,土壤中有机质的含量及组成有机质的胡敏酸()和富里酸()的比值()都会影响土壤光谱的反射特性,若的值大于,光谱反射曲线均以平直型为主,反之,则均以陡峭型为主。张治伟等指出土壤黏土矿物是土壤固相最活跃部分,其类型及组合对土壤物理化学性质影响较大。因此,土壤类型的多样性和成土因素的复杂性使得土壤光谱特性存在差异,这最终会导致针对某一特定类型或特定区域的土壤构建的重金属反演模型对其他土壤类型的适用性较差。土壤中的重金属含量一般较低,即使在重污染状态下,也很难 在 土 壤 反 射 光 谱 中 探 测 到 重 金 属 自 身 的 光 谱 特征,因此,直接根据重金属的光谱吸收特征进行反
6、演不可行。而研究表明,土壤中重金属的富集效应体现在土壤光谱活性物质(主要包括:有机质、铁锰氧化物和黏土矿物)对不同种类重金属离子的吸附作用,因此,土壤重金属元素对土壤光谱的影响间接反映在这些光谱活性物质的特征谱段上,从土壤反射率光谱中提取土壤光谱活性物质对应的特征谱段,即可通过这些特征谱段实现土壤重金属含量的间接反演。等 提取铁氧化物的特征光谱对土壤中的 含量进行反演,其建模精度比全谱段建模有了显著提升。贺军亮 则证明了利用有机质的诊断性特征光谱间接反演土壤重金属 的可行性。但是,这种间接反演方法在不同土壤类型间的适用性还有待探究。因此,有针对性地开展顾及土壤类型的重金属高光谱遥感反演方法的研
7、究,以湖南郴州东河流域矿区的黄壤和红壤样本为例,提取土壤样本实验室光谱中对 起主要吸附作用的土壤光谱活性物质对应的特征谱段,分别建立不同土壤类型的土壤重金属 含量间接反演模型,探索对 起主要吸附作用的光谱活性物质及其特征谱段对提高反演精度的有效性,以及土壤类型对这种间接反演方法的影响。实验部分 研究数据以湖南省郴州市东河流域铅锌矿矿区为研究区,海拔 ,当地多种植茶树,植被覆盖率高,土壤呈酸性,主要土壤类型为红壤,黄壤和水稻土。郴州开采了众多矿山,包括煤矿、铁矿、铅锌矿、石墨矿等。其中,清江铅锌矿即为郴州东河流域的重要矿山之一。年郴州的东河流域发生溃坝事件,郴州铅锌矿的尾矿库垮塌,虽然后续做了大
8、量的清理工作,但是该流域土壤仍存在严重的重金属(、等)污染。土壤样本采集与 含量测定 年沿东河西岸在 ,采集铅锌矿矿区土壤表层()样本共 个,取样点沿道路布设,其中黄壤样本 个,红壤样本 个,采样点分布如图所示。采样过程中,采用五点采样法在 范围内采集表层 深度范围内的土壤,混合提取约 样本装入密封的土壤袋中,将采集的土壤在实验室通风处晾干,用有机玻璃压碎去杂,然后用玛瑙研钵研磨,最后过 目的筛子得到分选良好的土壤样本,将土壤样本分为两部分,一部分用于测量重金属 的浓度,另一部分用于土壤样本的实验室光谱测量,均存储在专用的容器中。称 取 处 理 后 的 土 壤样本 ,采 用 消煮法在微波消解仪
9、进行消解,用电感耦合等离子体质谱 测定 元素的含量,对采集的每个土壤样本平行测定三次,取均值记为改样本的重金属含量。图研究区及土壤采样点分布 个土壤样本的重金属 含量统计值如表所示,其中黄壤样本 个,红壤样本 个。由表可知研究区内总样本 含量的平均值为 ,黄壤样本和红壤样本的 含量平均值分别为 、,含量远高于国家 土壤环境质量农用地土壤污染风险管控标准()风险筛选值 ,研究区内 含量严重超标。表土壤样本中 含量统计值 样本类别 ()()()()()总样本 黄壤样本 红壤样本 土壤反射率光谱测量光谱测定在一个暗室内进行,以一个 的卤素灯作为光源,利 用 便 携 式 光 谱 仪()和一个视场角为
10、的光纤测量土壤样本的反射率光谱。将光钎探头固定在土壤样本上方,为减少实验台的背景反射光,在实验台上铺一块黑布。将过 目筛的土壤样本以培养皿的形状依次、等距排列在黑布上。测量过程中使用一个 板作为定标板,用于土壤反射率定标。对每个土壤样品测量 条光谱,并记录平均光谱作为土壤样本的最终光谱。光谱预处理光谱预处理主要去除噪声对光谱的影响。首先,由于光光谱学与光谱分析第 卷图湖南郴州 个土壤样本光谱曲线 ,图黄壤和红壤样本光谱反射率曲线图():黄壤样本光谱反射率曲线图;():红壤样本光谱反射率曲线图 ():;():谱仪在波 长 区 间 两 端 的 信 噪 较 低,导 致 土 壤 反 射 光 谱 在 和
11、 噪声非常严重,故将这两个区间的光谱去除;其次,在余下的 范围内仍存在不同程 度 的 噪 声,分 为 三 个 噪 声 区 间:和 为 严 重 噪 声 区 间;和 为中度噪声区间;剩余的 为轻度噪声区间。采用分段 ()滤波进行噪声去除,分别采用窗口大小为 个、个和个波段的二次多项式对严重噪声、中度噪声和轻度噪声区间进行滤波处理。经过去噪后的 个土壤样本的光谱反射率曲线图如图所示,黄壤和红壤样本的光谱反射率曲线图如图所示。为减小高光谱波段之间的相关性,增强光谱的反射特征,对光谱进行一阶微分处理,一阶微分公式如式(),()式()中,为光谱的一阶微分结果,为第个波段的反射特征,为光谱波段总数。研究方法
12、技术流程图如图所示。首先,获取土壤样本的实验室光谱并对其进行 滤波和包络线去除;其次,根据土壤光谱活性物质对 的吸附作用,从土壤光谱中提取有机质和黏土矿物的特征谱段;最后,分别对黄壤样本和红壤样本进行基于 算法的 含量估算,并对结果进行精度评价。图研究方法技术流程图 土壤光谱活性物质特征谱段提取基于土壤反射光谱重金属含量估算机理研究表明,有机质和黏土矿物对 的吸附作用是土壤反射光谱对 含量估算的主要机理,有机质对土壤反射光谱影响最大的范围在 之间,对于风干后的土壤黏土矿物(主要指硅酸盐类黏土矿物,包括高岭石、蒙脱石、蛭石等),受羟基官能团和矿物富含的层间水分影响,在 、和 附近具有较强的光谱吸
13、收特征。因此,土壤反射率光谱曲线 附近的吸收峰可认为是土壤有机质的吸收特征,以 、和 为中心的吸收峰为土壤黏土矿物的吸收特征。为获取有机质和黏土矿物的特征谱段,采用包络线去除的方法增强土壤光谱的吸收特征。第期张霞等:顾及土壤类型的土壤 含量高光谱遥感反演 训练集和验证集划分训练样本和验证样本的划分对重金属反演建模的精度有很大影响。选择 ()算法进行样本划分,主要原因在于该算法同时考虑到光谱空间和性质空间(如重金属含量)对样本划分的影响,使得训练集和验证集的划分更加合理。首先将样本按照性质空间的大小进行排序,将排序后的样本等分,然后在等分的个小区间内分别利用 ()算法选出在光谱空间具有代表性的样
14、本作为训练集,从而提高训练集划分时在性质 空 间 分 布 的 均 匀 性。取 反 演 精 度 最 好 时 对 应的值。基于遗传算法改进的波段选择算法在应用土壤光谱活性物质特征谱段进行反演建模前,采用改进的遗传算法(,)进一步减少参与建模的波段的个数,降低波段间相关性,以提高模型估算精度。将模拟退火算法中的 准则和传统的算法相结合,在生成新种群时,当新个体目标函数值小于父个体目标函数值时,用新个体取代父个体,否则以一定的概率接受该新个体取代父个体,从而解决算法经常会存在的过早收敛问题。能够在运行前期跳出局部解区域,寻找更优解。本研究采用 优选能够获取适应度函数最大值的波段组合,将该组合作为自变量
15、集合,进行 含量的反演建模。参考现有土壤重金属含量估算研究中对参数的设置,参数的设置如下:染色体个数为,代际间隙为,迭代次数为 次,基因变异概率为,目标函数为交叉验证的均方根误差。偏最小二乘回归算法及其评价指标野外土壤采样受限于采样、制样与化验操作环节多、成本高的限制,往往仅限于少数几个野外站点,很难获得大量的土壤样本,。偏最小二乘回归算法()兼具主成分分析、典型相关分析和线性回归的优点,在样本数量较少,甚至样本点个数小于自变量个数、自变量之间相关性比较严重的情况下依然可以比较好的进行建模分析。基于此,采用 建立 含量的反演模型。此外,为降低土壤样本数量较少造成的过拟合的风险,通过确定最大 变
16、量个数来限制 的变量个数。根据 变量对因变量信息量的解释能力,设置一个阈值来确定最大 变量个数。如果新的 变量的加入对因变量信息量的解释能力不能超过这个阈值时,就停止加入新的 变量,将当前的变量个数认为是最大的 变量个数。在最大的 变量个数内,采用交叉验证的最小均方根误差确定建模所用的 变量个数。结合 变量个数对因变量信息量的解释能力,将阈值设置为。即,当新加入的 对土壤属性变量信息量的解释不足时,停止新加入变量,当前已经加入的变量个数为 的最大变量个数。对 建立的土壤重金属反演模型,采用预测均方根误差()、相对偏差()、决定系数()进行评价。三者的计算公式如式()(?)()()(?)(?)()其中,和?分别是第个土壤样本的重金属含量分析值和经过 建模之后的估算值,是验证样本的个数,是验证样本数据的标准差,?是验证样本数据的平均值。模型的评价参考现有的土壤属性含量高光谱估算的评价标准:出色模型,;良好模型,;近似模型,;具有一定估算能力,;不具备估算能力,。结果与讨论将采集的黄壤和红壤样本分别采用 算法划分训练集和验证集,然后对有机质和黏土矿物的特征谱段进行一阶微分处理,一阶微分处理有