1、第40卷 第1期2023年2月海洋预报MARINE FORECASTSVol.40,No.1Feb.2023收稿日期:2022-03-20;修回日期:2022-06-15。作者简介:王洁(1982-),女,副教授,博士,主要从事海洋遥感研究。E-mail:*通信作者:栾奎峰(1981-),男,副教授,博士,主要从事海洋测绘与遥感研究。E-mail:北太平洋表层海水pH值的重建王洁1,2,毛景景1,吕阳阳1,王杰1,栾奎峰1,2*(1.上海海洋大学 海洋科学学院,上海 201306;2.上海河口海洋测绘工程技术研究中心,上海 201306)摘要:以19932018年北太平洋海表面温度(SST)、
2、海表面盐度(SSS)、叶绿素a浓度(Chl-a)、二氧化碳分压(pCO2)等数据为基础,利用传统线性回归分析和BP神经网络算法,建立表层海水pH值的预测模型。结果表明:两种方法对于重建北太平洋表层海水pH值都能达到较高的精度,其中线性回归模型基于SSS、Chl-a、pCO2参数模拟最佳,BP神经网络模型基于SST、SSS、Chl-a、pCO2参数模拟最佳。对比两种最佳模型的均方根误差和拟合系数发现,BP神经网络模型优于线性回归模型。除此之外,最佳BP神经网络模型在4个季节的拟合效果均很好,不同季节的适用性远高于最佳线性回归模型。表层海水pH值受到多种因素的综合影响,与pCO2、SST呈负相关关
3、系,与SSS、Chl-a呈正相关关系。应用最佳BP神经网络模型重建北太平洋表层海水pH值发现,本研究模型的预测结果与已有研究、哥白尼欧洲地球观测计划数据、站点实测数据都存在很好的一致性,表层海水pH值冬季高于夏季,整体呈现西北高东南低的趋势。关键词:线性回归;BP神经网络;表层海水pH值;模型;重建中图分类号:P734.2+5 文献标识码:A文章编号:1003-0239(2023)01-0046-11DOI:10.11737/j.issn.1003-0239.2023.01.0061引言太平洋作为世界上最大的大洋,对全球气候变化起着关键作用,丰富的渔业资源也为太平洋岛屿国家的经济发展提供了机遇
4、1-3。由于近年来人为排放CO2增加,被海洋吸收后导致北太平洋酸化现象愈发严重,其正在改变并影响着海洋生物赖以生存的化学环境 4-5,也破坏着海洋生物多样性和生态系统的平衡6-8。表层海水pH值作为衡量海水酸化程度的关键指标,是海洋酸化研究的主要参数,北太平洋海水pH值实测数据的缺失使得重建表层海水pH值非常有必要。表层海水pH值的重建有助于加强对北太平洋海域酸化的认识,提高海洋酸化预测的准确性,更好地理解海洋环境因子与海洋酸化之间的作用机理,对填补该海区酸化研究的缺失、探究大洋酸化和全球碳循环问题具有重要意义,同时也为缓解海洋酸化提供基础资料,为海洋生态系统的稳定维护提供理论依据。目前,海水
5、pH值的重建方法主要有线性回归、动态物理模型及海水碳酸盐系统模型,各模型的优点及局限性见表1。线性回归方法已较为成熟,国内 外 学 者 李 福 荣9、石 强 等10、杨 顶 田 等11、NAKANO 等12、ALIN 等13、LI 等14、SRIDEVI 等15已经开展了一系列利用传统线性回归方法重建表层海水pH的研究,但这些结果具有一定的区域、季节适用性;WOOTTON等16基于多种海洋物理特性建立的表层海水pH模型较为复杂;GREGOR等17利用测量的总碱度(Total Alkalinity,TA)和推导出的二氧化碳分压(pCO2)重建的表层海水pH值具有误差传递性,模型精度存在一定的局限
6、性。相比之下,BP(Back Propagation)神经网络作为一种根据误差逆传播算法训练的多层前馈网络,可以储存及学习大量的输入和输出数据,具有很强的模拟能力18。目前,人工神经网络已经被广泛地应用于 pCO2、王洁等:北太平洋表层海水pH值的重建1期TA、无机碳等化学要素的重建过程中19-23,研究表明BP神经网络算法在重建表层海水pH值方面具有巨大的潜力。基于此,本文以北太平洋为研究区域,通过筛选与表层海水pH值具有较强相关性的参数及参数组合进行模型演算,进而比较传统线性回归分析和BP神经网络算法在重建北太平洋表层海水pH值方面的能力。2数据与方法2.1数据源本研究中,表层海水 pH
7、值、海表面温度(SeaSurface Temperature,SST)、海表面盐度(Sea Sur-face Salinity,SSS)、海表面叶绿素 a浓度(Chl-a)和pCO2等数据来源于哥白尼欧洲地球观测计划(Co-pernicus Marine Environment Monitoring Service,CMEMS),数据分辨率均为0.250.25,各参数精度评价见表224-25,评价指标包括相关系数(r),偏差(Bias)和 均 方 根 误 差(Root Mean Square Error,RMSE),这些指标能够量化大尺度和季节性时间尺度的偏差。目前,这些数据被广泛应用于海洋酸
8、化的研究中26。由于这些数据产品重建表层海水pH值时需要考虑平均海平面、硝酸盐、磷酸盐、溶解氧、浮游植物等多种海洋物理化学特性,所用模型较为复杂,故本文采用相对简单的线性回归和 BP神经网络算法对表层海水 pH 值进行重建。本文以 1060N,119E110W 为研究范围,随机选取 19932018 年北太平洋表层海水 pH 值、SST、SSS、Chl-a 和 pCO2的月平均数据,共 76 000 组,其中 36 000组数据用于表层海水pH值模型的建立,20 000组数据用于模型验证,20 000组数据用于分析模型在不同季节的适用性(春、夏、秋、冬数据各 5 000组)。此外,为了进一步验
9、证模型在北太平洋的重建能力,本文还收集了来自美国国家海洋和大气管理局(National Oceanic and Atmospheric Ad-ministration,NOAA)国家环境信息中心(NationalCenters for Environmental Information,NCEI)3个时间序列站点的实测数据,包括KEO站点数据(20012002年、20052015年)、CCE1站点数据(20012011年、20132014年)和Kaneohe站点数据(20012006年、20122016年),站点位置见图1。表2 数据源各参数的精度评价Tab.2 Accuracy evalua
10、tion of each parameter of thedata source参数SSTSSSChl-apHr0.8110.952Bias0.260.02RMSE0.760.220.590.04图1研究区域Fig.1Domain of study area2.2模型重建方法本文主要运用传统线性回归分析和BP神经网络算法对表层海水pH值进行模型重建。传统线性回归分析是指用于分析一个连续型因变量与一个表1海水pH重建方法Tab.1 Reconstruction method of seawater pH方法线性回归动态物理模型海水碳酸盐系统模型优点方法简单模拟精度高适用范围广局限性建模参数不全面
11、存在区域、季节限制性考虑物理因素多,模型复杂误差传递性明显参考文献李福荣9、石强等10、杨顶田等11、NAKANO等12、ALIN等13、LI等14、SRIDEVI等15WOOTTON等16GREGOR等1747海洋预报40卷或多个自变量之间线性关系的统计学分析方法27,该方法可以对因变量进行有效的预测分析。一般用R表明变量之间的相关程度,决定系数(R2)判定模型的拟合效果。BP神经网络是一种基于误差反向传播的多层前馈神经网络,它可以通过对训练样本的反复学习,不断地调整各层间的连接权值和阈值28,从而使输入信息接近所期望的输出信息。本文使用的BP神经网络结构如图2所示,包括输入层(SST、SS
12、S、Chl-a、pCO2)、输出层(pH)和隐含层。图2BP神经网络结构图Fig.2Structure of BP neural network3结果3.1线性回归模型的建立与验证本文使用最小二乘法对SST、SSS、Chl-a、pCO2及各参数组合与表层海水 pH 值进行线性回归分析,得到建模R20.95的6个线性方程(见表3)。结果表明,这6个线性方程在模型验证中的RMSE、标准差(Standard,STD)均小于 0.11,方差(Variance,VAR)均小于0.008 6,各组合差别不大,用于重建北太平洋表层海水pH值都是可行的。基于SSS、Chl-a、pCO2这 3个参数和基于 SS
13、T、SSS、Chl-a、pCO2这 4个参数建立的表层海水pH值模型的R2相对较高,分别为0.959 0与0.959 4,但在模型的验证中,前一个参数组合的RMSE、STD以及VAR在这6个模型中最小。从图3可以看出,基于传统线性回归方法建立的6个表层海水pH模型的预测值与真实值极为接近,其中,基于SSS、Chl-a、pCO2参数的模型相关系数最大,达到0.976 6,模型的拟合效果最优。通过综合评定可以发现,8.309 6+0.003 1SSS+0.012 6Chl-a-0.000 988pCO2是最佳的线性回归模型。3.2BP神经网络模型的建立与验证使用与线性回归方法建模相同的 36 00
14、0组数据作为训练数据,用以生成训练模式文件,20 000组数据作为测试数据,用以生成测试模式文件。通过将筛选出的不同建模参数及组合作为输入层的神经元进行模型的训练和演算,得到R20.95的6个BP神经网络模型(见表4),各参数组合的RMSE均小于0.015,r均大于0.97,其中以SST、SSS、Chl-a、pCO2这4个参数建立的BP神经网络模型的训练结果和测试数据的R2和r最大,RMSE最小。表3 基于线性回归方法的表层海水pH重建模型的输出结果Tab.3 Output results of pH reconstruction model based on linear regressio
15、n建模数据(n=36 000)参数组合SST+pCO2SSS+pCO2Chl-a+pCO2SST+SSS+pCO2SSS+Chl-a+pCO2SST+SSS+Chl-a+pCO2R20.950 30.952 20.952 60.952 20.959 00.959 4线性方程8.421 2+0.000 1SST-0.001pCO28.365 9+0.001 7SSS-0.001pCO28.416 9+0.007 1Chl-a-0.000 99pCO28.363 2-0.000 023 8SST+0.001 8SSS-0.000 999 7pCO28.309 6+0.00 31SSS+0.012
16、6Chl-a-0.000 988pCO28.319 7+0.000 128SST+0.002 8SSS+0.013 6Chl-a-0.000 992pCO2验证数据(n=20 000)RMSE0.009 80.008 80.010 30.008 90.008 40.008 7STD0.009 70.008 70.010 30.008 60.008 40.008 6VAR0.000 0950.000 0750.000 1060.008 6000.000 0710.000 07448王洁等:北太平洋表层海水pH值的重建1期表4 基于BP神经网络方法的表层海水pH重建模型的输出结果Tab.4 Output results of the surface seawater pH based onthe BP neural network model参数组合SST+pCO2SSS+pCO2Chl-a+pCO2SST+SSS+pCO2SSS+Chl-a+pCO2SST+SSS+Chl-a+pCO2R20.963 30.955 10.953 80.968 20.969 10.970 2RMSE0.00