受访专家:谢元富(粤港澳大湾区气象监测预警预报中心,首席科学家)
采访小组:薛建军,王卓妮(干部学院)
技术革新对学科前沿领域发展的带动效应是不可忽视的。作为大气科学发展的重要标志,数值预报技术早已引发了一场“静悄悄的革命”,它的巨大成功和飞速进步无疑是建立在多年稳步持续的科学认知与技术进步的积累之上。当前人工智能技术的加速突破应用,为气象科技发展提供了更多创新源泉,气象科技正孕育着新的变革。
从学科发展来看,由于在现有科学范式下,基于大气动力学理论为依据所开展的以数值模式为核心的研究,难以或者需要花费更多的代价才能取得新的重要突破。因此,大气科学的发展除了坚持“传统”技术路线外,似乎亟待寻求新的结合点和突破点,而人工智能(AI)技术在气象领域的加速应用被赋予了更多的期待。从业务布局上看,欧、美、中等全球主要的气象机构除了相继巩固在“传统”数值预报领域的优势地位,也不断强化人工智能技术在其业务、科研中的布局和应用,新型气象业务体系的变革似乎在加速到来。
如果说上个百年中,数值预报的概念及其技术的发展奠定了大气科学近半个世纪的迅猛发展,那么人工智能的介入会不会是大气科学下一个十字路口。近年来,围绕“数据驱动”“数理驱动”,亦或是“数据+数理双轮驱动”引发了诸多讨论。为此,专题采访小组围绕这一焦点问题展开系列访谈。
本次推送两问
:
“数据驱动”能否替代“传统”数值预报?
一问:
近年来,人工智能迎来爆发式发展,加速“科研范式”转变(图1),特别是ChatGPT、Sora等大模型再一次“引爆”全球人工智能产业布局,加速推动新一轮科技革命和产业变革。同样地,在大气科学/地球系统科学领域,人工智能融合应用蓬勃发展,但一些观点似乎过有于夸大其能力之嫌,同时也有一些观点持怀疑甚至抵触态度,
对此,您怎么看?
图1(上图)
Scopus
数据库中标题或摘要中提及AI或AI相关关键词的论文占比(
Richard
Van Noorden
等
2023
);(下图)
AI
如何改变科学《
Nature
》杂志封面(
2023
)
答:
技术变革往往会引发人们的不同反应,争论和关注都是常见的现象。这是正常的
。
例如,在数值预报领域,人工智能的新技术和方法的确能够帮助提高预报的准确性。然而,尽管这些进展显著,人工智能技术目前还存在
一定的局限性
。它在很大程度上依赖于使用的数据,并且还不能真正解释这些数据背后的物理原理,
很难针对极端天气做出稳定的预报,特别是历史资料里少见的。
尽管技术进步
带来了快速的成果
,
我们也可能遇到
一些抵触情绪
,
这是在技术发展过程中
难以避免的
。
在我国数值天气预报与国际上先进水平还存在系统性差距的情况下,会有很多研究人员希望利用人工智能超车,这是完全可以理解的。至少目前我国的气象大模型预报还是走在前列的。但是无论从事什么样工作的研究人员,还是应该静下心来,客观地分析和理解这个新挑战,而非采取无限夸大或消极的抵触和回避,
应该用科学的态度来面对
。
一种是夸大人工智能的说法,就是数值预报完全是浪费资源,可以用人工智能完全取代数值预报,包括资料同化。对持有这样观点的同事,我们是不是应该想一想,如果我们知道空中有一颗苹果会按地球引力下落,但是我们非要假装不知道这个定律,非要用人工智能去学习这个过程。这不也是一种浪费吗?我们在计算机科学系学习人工智能课程时,老师们总是说
“
用人工智能来解决不知道的问题,而不是用它去学习已知事实
”。
另一种是怀疑或抵触的说法,就是对于数值天气预报这么复杂的问题,怎么可能用一个没有任何气象背景的模型做好呢?数值预报是物理定律导出来的。那么,
我们也应该客观的认识到现有数值预报系统里还有大量的问题是无法用数学或物理方程来表达的
。
太多不确定的问题制约着数值预报的发展。比如目前全球的网格模式还存在着各种各样问题,包括精度问题、计算效率不高等。目前,机器学习在某些场景下的一些预报检验指标比数值预报还要好,这也一定程度上反映了当下数值预报存在的某些问题。
二问:
数值预报技术奠定了当代大气科学发展的基石,但是受制于模式、初值以及大气海洋等非线性系统的不稳定性等因素,数值预报始终难以逾越“可预报性”的制约(图2)。除了深耕“传统”数值预报,从技术发展的视角看,
气象领域的“人工智能”会不会是或者有多大可能是另一个“数值预报”
?
假设在下个10年,人工智能对大气科学的作用类似于百年前的数值预报,那么您认为
还有哪些障碍或者要“妥善”解决哪些问题才能达成这一愿景
?
图2 (上图)数值模式建模面临的难题(
Peter
Bauer
等,2019);
(下图)不同预报方法可预报性的问题
答:
这是个非常有意义的问题,也是事关天气预报未来发展的方向性问题。抛开具体技术,天气预报中还有许多问题没有完全解决,包括一些理论性问题。例如数值预报中为了保持数值稳定性,都添加了远超过实际大气的阻尼或耗散项,无法真正反映大气中的非线性问题(如二分叉(bifurcation)问题)。但是这样的问题,当下依赖于再分析的人工智能气象大模型也不能解决,特别是这样的天气过程又是非常罕见的,无法通过历史数据训练出一个好的人工智能模型来应对。这需要大家联手一起研究新的解决方法。
尽管我们还很难估量下一个
10
年人工智能对大气科学的作用,但是有大量的科学和技术问题有待人工智能技术来帮助解决
。
简单罗列,至少有这些问题:
• 天气预报中不确定性的物理、陆面和微物理问题
• 观测资料的误差、缺失、修正等问题
• 预报中的偏差订正
• 天气过程中的非线性和不稳定问题
• 如何提高数值预报计算效率问题
说到障碍,
我认为目前急需解决的还是学科脱节的问题,尤其是计算机科学(人工智能)与大气科学的脱节
。
大气科学对计算机科学的应用还是有待提高的,简单的例子就是气象系统里的软件设计和开发。尽管越来越多的业务中心有计算机专家参与,但是这个磨合过程还是太慢了。在天气预报方面,
特别需要计算机科学(人工智能)专家与大气科学专家的深度的融合来一起梳理、研究科学问题,而非就技术论技术
。
其次是如何开展深入研究的问题。现在很多大气科学的专家对人工智能是持拥抱的态度,一些具有不确定性的问题,通过应用人工智能已经或正在取得明显成果。
这样的成果会很快不断扩大,但会很快达到饱和状态
。
因为从某种意义上来说,目前很多人工智能的改进还都是用大模型来代替传统意义上的统计方法获得的。然而,
深入的科学研究才是给我们带来所期待的突破性工作
。
这些突破也是应该从更高层面给予支持和帮助,特别是营造深入研究的环境和氛围,让科学家能够静下心来做研究,而不以简单、快速的研究成果来追逐经费、项目和文章。举一个需要研究的例子,大模型的“Grokking”现象。“Grokking”现象是指在深度学习模型训练过程中,模型在长时间拟合训练数据后,会突然出现的一种奇特现象。具体表现为,模型在经过进一步训练后,会从完美的训练准确度过渡到完美的泛化能力。尽管人工智能是不可解释的,但是什么时候、什么情况下“Grokking”现象会出现,如何去触发这样的现象出现?也许这些思考会对大模型的预报发展提供一些突破性的机会。
总之,我认为真正实现咱们这里讨论的“愿景”
,
需要突破专业阻碍、深入的科学研究,而不是简单地用大模型来改进一些预报的或产品的指标。
——————————————————————————————————
声明:
欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编
(微信:qxxjgzh)
处理。