ImageVerifierCode 换一换
格式:PDF , 页数:15 ,大小:1.66MB ,
资源ID:356477      下载积分:10 积分
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wnwk.com/docdown/356477.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(地球表层特征参量反演与模拟的机理-学习耦合范式_沈焕锋.pdf)为本站会员(哎呦****中)主动上传,蜗牛文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知蜗牛文库(发送邮件至admin@wnwk.com或直接QQ联系客服),我们立即给予删除!

地球表层特征参量反演与模拟的机理-学习耦合范式_沈焕锋.pdf

1、地球表层特征参量反演与模拟的机理-学习耦合范式沈焕锋1,2,张良培3*1.武汉大学资源与环境科学学院,武汉 430079;2.地理信息系统教育部重点实验室,武汉 430079;3.测绘遥感信息工程国家重点实验室,武汉 430079 通讯作者,E-mail:*通讯作者,E-mail:收稿日期:2022-03-27;收修改稿日期:2022-08-09;接受日期:2022-09-08;网络版发表日期:2023-01-19国家自然科学基金重点项目(批准号:42130108)资助摘要构建物理驱动的机理模型一直是估算地球表层特征参量的核心科学范式,发展数据驱动的机器学习模型是地学研究范式转换的重要途径,而

2、耦合机理模型与学习模型则可以实现“理性主义”与“经验主义”的结合,是当前最受关注的研究热点之一.文章针对参量估算的遥感反演与动力学模拟方法,深入分析了机理模型与学习模型的内在瓶颈及其互补性,搭建了以机理级联学习、学习嵌入机理、机理融进学习为核心的耦合范式框架,归纳了预处理与初始化、中间变量传递、后置精化处理、模型替代、模型调整、模型求解、输入变量约束、目标函数约束、模型结构约束、混合应用等十种具体耦合方式,剖析了当前的主要问题与未来的挑战方向.研究为深入理解、应用机理-学习耦合模型提供了新视角,为提升地球表层特征参量反演与模拟能力、服务地球系统科学发展提供理论与技术支撑.关键词机理模型,机器学

3、习,模型耦合,遥感反演,数值模拟1引言地球表层过程的气候变化、环境污染等问题,深刻影响着人类的生活生产与生命健康.要深刻理解地球表层复杂的自然与人文现象、促进社会经济的可持续发展,需要综合、完整和持续的感知数据(中国科学院地学部地球科学发展战略研究组,2009).卫星遥感反演与动力学数值模拟是获取宏观、连续地球表层特征参量数据的两个重要手段(陈发虎等,2019),如何不断提升遥感反演与数值模拟的精度与能力,是地球表层系统科学研究的关键基础问题.无论是遥感反演还是动力学数值模拟,构建物理可解释的机理模型一直核心的科学范式(De Bzenac等,2019).在遥感反演方面,基于辐射传输物理过程的定

4、量反演是获取水、土、气、生等多个圈层特征参量的主要途径,研究学者已发展了大量具有严格物理中文引用格式:沈焕锋,张良培.2023.地球表层特征参量反演与模拟的机理-学习耦合范式.中国科学:地球科学,53(3):546560,doi:10.1360/SSTe-2022-0089英文引用格式:Shen H,Zhang L.2023.Mechanism-learning coupling paradigms for parameter inversion and simulation in earth surface systems.Science ChinaEarth Sciences,66(3):

5、568582,https:/doi.org/10.1007/s11430-022-9999-9 2023 中国科学杂志社中国科学:地球科学2023 年第 53 卷第 3 期:546 560SCIENTIA SINICA T论 文机制的遥感反演方法(李小文,2005;梁顺林等,2016;李召良等,2016),并发布了系列全球及区域尺度的定量遥感参量产品(张正等,2016).在数值模拟方面,各国科学家构建了多种大气数值模型(Skamarock等,2005)、陆面过程模型(孟春雷和戴永久,2013)、水文模型(Arnold等,1998)等,并基于超级计算平台开发了地球系统模拟器(陈春等,2005;邱

6、晨辉,2021).总之,以物理驱动为基础的机理模型是地球表层特征参量反演与模拟的“主框架”(De Bzenac等,2019),是地学知识发现的重要基石(Karpatne等,2017b).近年来,地球科学正在经历从数据匮乏到数据丰富的转变(Karpatne等,2019),人们获取与生产时空数据的能力已经远大于对其进行处理、分析与理解的能力(Reichstein等,2019).在此背景下,基于大数据的第四科学范式悄然崛起,并成为地学研究的重要支撑(郭华东等,2014;宋长青,2016;程昌秀等,2018;邓敏等,2020;周成虎等,2021;李新等,2022).以机器学习为代表的人工智能技术发展迅

7、猛,被认为是挖掘大数据潜力的“金钥匙”(郭仁忠等,2020;陈军等,2021),在卫星遥感与数值模拟领域受到广泛关注和快速发展(Hsieh和Tang,1998;黎夏和叶嘉安,2005;宫鹏,2009;Hrter和de Campos Velho,2010;张兵,2018).在IEEE地学与遥感学会组织的融合分析大赛中,深度学习模型获得了近年多数赛道的冠军(黄昕等,2021);在定量应用方面,机器学习模型已被广泛地应用于数十种特征参量的遥感反演(郭庆华等,2020;Yuan等,2020;胡斯勒图等,2020;冉有华等,2021).与此同时,机器学习也已被成功应用于大气(Navares和Aznart

8、e,2020)、水文(Petty和Dhingra,2018)、海洋(De Bzenac等,2019)等地表过程的模拟预测,并表现较大的应用潜力.有鉴于此,机器学习被期待成为释放数据驱动潜能、加速科学发现的重要框架(Karpatne等,2017b),有学者认为它将地学研究推向即将取得重大进展的门槛(Bergen等,2019).显而易见,以大数据为支撑的机器学习模型已经对正统的机理模型形成冲击(裴韬等,2019),甚至有学者认为可能导致“理论的终结(the end of theory)”(An-derson,2008).然而,一些学者却坚持当前普遍存在“大数据傲慢”问题(Lazer等,2014),

9、机器学习的效能被高估.例如,谷歌发布神经网络降水预报模型MetNet(Snderby等,2020),声称在8h的预测中神经网络模型已经优于机理模型,但是其在学术界受到不少质疑,至少在长期预测、大尺度预测等方面其仍然不能替代机理模型(Witt等,2021;Chantry等,2021).针对机器学习的地学应用问题,Nature、Science等期刊近期相继发表论文(Bergen等,2019;Reichstein等,2019;Bauer等,2021),认为地学过程的复杂性、交互性、多尺度特性,以及数据的不确定性、真实样本的稀缺性等,使得机器学习模型仍然不能替代机理模型,但是两种模型具有天然的互补优势

10、,耦合机理模型与学习模型是极具前景的发展方向.然而,将显式的机理模型与隐式的学习模型进行耦合存在诸多挑战,尽管当前已经取得了一些研究进展,但仍然缺乏标准、统一的范式框架,导致相关研究模式各异、缺乏关联,甚至出现相互混淆的问题.本文在充分归纳现有工作基础之上,力图构建系统的机理-学习耦合范式框架,剖析不同耦合方式的特点与潜力,并展望未来的挑战方向,以期为相关研究提供理论与应用参考,促进地球表层特征参量遥感反演与数值模拟技术发展,为提升地球表层特征参量估算能力、服务地球系统科学发展提供理论与技术支撑.2两种模型的优势与瓶颈2.1机理模型“机理”可以广义地理解为任何表达地理对象属性或要素之间有效关系

11、的知识(von Rueden等,2023),既包括物理知识,也包括几何约束、地学规律等.机理模型遵循客观规律建立输入与输出之间的显式关联,帮助人们认识与理解所生存的物理世界(Karpatne等,2017b).经典的定量遥感反演方法基于大气辐射传输等模型,将对地观测的电磁波信号与特征参量建立关联,实现对地球表层的面域感知;数值模拟系统通过其内在物理过程和动力学机制,获得地理对象在时间和空间上的连续演进(李新等,2007).可见,机理模型可以较为清晰地描述系统的内部特性,理论严谨、模型(相对)稳定、结果可解释是其突出的优点.然而,机理模型也存在其难以克服的不足.(1)机理认知局限.地球表层系统是多

12、要素混杂、多尺度耦合、多过程交织的复杂巨系统(陈旻等,2021),现有的机理模型仍然难以实现对所有地学过程的精准刻画,一些物理过程仍然未知.例如,当前仍然缺乏针对很多参数(如气温、PM2.5等)的遥感机理反演中国科学:地球科学2023 年第 53 卷第 3 期547模型,数值模型中也并非所有子过程都可以进行精确物理建模,约简或近似处理往往导致不确定性.(2)欠定系统问题.即使一些地学过程的机理较为清晰,但参量反演往往是一个欠定系统,即观测方程个数少于未知数个数,导致模型求解十分困难,对此通常需要一些假设条件,而当假设条件与真实不符时就会带来较大的求解误差.例如,地表温度遥感反演就是利用N个观测

13、值(波段数)解决N+1个未知数(N个地表发射率和地表温度)的病态问题.(3)计算负担问题.一些机理过程的计算量巨大,例如,在美国大气研究中心的大气模式中,物理过程的计算占到整体模型计算量的70%(Krasnopolsky等,2005).如果进一步提升在分辨率、一致性等方面的要求,计算量又将呈指数上升,带来较大的应用困扰.2.2学习模型机器学习模型通过“训练”与“预测”模拟人类的“归纳”与“推测”过程,实现对典型问题的建模与求解.与机理模型的显式表达不同,学习模型通过对数据的训练建立不同变量之间的隐式关联,即往往是典型的“黑箱”模型.学习模型的关键优势之一就是当机理未知时,可以跳过对物理过程的理

14、解而直接进行数据驱动的建模,特别是在训练数据充足的条件下,往往可以获得较高的建模精度.此外,机器学习虽然在训练阶段比较耗时,但在测试应用阶段一般具备较高的计算效率,也成为其重要的优势之一.尽管如此,机器学习模型仍然具有诸多局限,特别是在过程复杂的地学应用中经常存在如下问题:(1)泛化性不足.缺乏足够的训练样本是机器学习地学应用中最为常见的问题,而利用有限的样本去学习复杂的地学过程,极易出现过拟合现象,即使在训练样本上表现出较高的建模精度,测试应用精度也会大幅降低.特别是当实际的数值范围、变量关系等没有被训练样本所涵盖时,预测结果更可能出现极大偏差,即典型的泛化能力不足问题.(2)迁移性不足.区

15、域性是地理学的本质特征,不同区域之间不仅表现为不同地理要素的差异,更表现为各要素之间关系的差异.因此,在某一区域训练的机器学习模型往往难以迁移到其他区域进行应用.其次,地球表层要素及其相互关系也处于不断变化的过程中,人类活动影响使之变化更为剧烈,如此同一区域不同时间跨度的模型也往往难以通用.此外,尺度迁移性不足也是地学应用中的又一困境.(3)可解释性不足.科学研究的目标不仅在于发展一个可用的模型,更加在于发现不同变量之间的内在因果关系与驱动模式,并用之实现对理论与假设的解释,从而促进科学知识的进步(Karpatne等,2017a).机器学习的一个突出问题就是在可解释性方面存在不足,虽然在特定条

16、件下也可以获得比较高的精度,但缺乏对内在机理过程的解释能力.通过以上分析可见,机理模型与学习模型虽然各有其建模优势,但也都存在难以克服的不足.显然,二者之间具有天然的互补性(Ganguly等,2014;吴志峰等,2015),耦合机理模型与学习模型可以实现“理性主义”与“经验主义”的结合,可以有效调整机理模型的“偏见”,避免学习模型的“傲慢”(Chantry等,2021),因此是必然的发展趋势.3机理模型与学习模型的耦合范式机理模型与学习模型的耦合近期成为各领域的研究热点,但实际上从20世纪末开始,无论在数值模拟(Chevallier等,1999)还是遥感反演(Aires等,2001)领域,就已有机理模型与学习模型耦合的思想与成功案例,但受认知水平与技术条件的限制,该方向研究并没有得到足够的关注与发展.直至最近,随着神经网络特别是深度学习技术的再度崛起,机理-学习耦合已成为包括地学在内诸多领域的研究热点.近年来,在英文文献中出现了诸多表达机理模型与学习模型耦合的名词术语,可从图1所示的三列之中各任选一词连接起来,如“Physics Informed MachineLearning”等.然

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2