主要观点总结
Google Research团队开发的AI模型NeuralGCM在天气预测和气候模拟方面展现出强大的能力,达到甚至超过了现有传统数值天气预报模型和其他机器学习(ML)模型的准确度。该模型结合了机器学习和物理方法,可用于长期天气和气候预测,对减少灾害影响、理解气候缓解和适应等具有关键作用。
关键观点总结
关键观点1: NeuralGCM模型简介
NeuralGCM是结合机器学习和物理方法的模型,旨在提高天气预测和气候模拟的准确性和速度。
关键观点2: NeuralGCM的预测能力
NeuralGCM在超短期、短期和中期时间尺度上的预测能力已经与最先进的模型相媲美,甚至在某些方面表现更好。
关键观点3: NeuralGCM在气候模拟方面的表现
NeuralGCM能够准确地模拟季节循环、热带气旋和历史温度趋势等关键气候指标,展现出强大的气候模拟能力。
关键观点4: NeuralGCM的局限性
虽然NeuralGCM在天气和气候预测方面取得了重大进展,但它仍然面临一些局限性,如对未来气候的预测能力有限、模拟未观测气候的挑战、物理约束和数值稳定性问题,以及缺乏与其他地球系统组件的耦合等。
关键观点5: 传统天气预测和气候模拟的现状
传统天气预测和气候模拟正在被AI技术颠覆。许多科技公司和高校都在这一方向取得了重大进展,包括盘古气象模型、NowcastNet模型等。
正文
撰文|马雪薇
编审|库珀
来自世界气象组织(WMO)的数据显示,在过去 50 年里,平均每一天都会发生一场与天气、气候或水患有关的灾害,而
每一场灾害平均会造成约 115 人死亡、约 2.02 亿美元的经济损失
。
更令人唏嘘的是,近年来,由人类活动加速的气候变化,更是使得热浪、寒潮、强降水、干旱等极端天气和气候灾害异常频发。
因此,
及时、准确
的天气预测和气候模拟不仅可以每年帮助挽救数万人的生命,还能够降低极端天气和气候事件对人类社会和生态系统的灾难性影响。
如今,
由 Google Research 研究团队及其合作者开发的人工智能(AI)模型 NeuralGCM,将天气预测和气候模拟提升到了一个新的高度
——
-
NeuralGCM 对 1-15 天预报的准确率,媲美欧洲中期天气预报中心(ECMWF),后者拥有世界上最先进的传统物理天气预报模型;
-
对提前 10 天预报的准确率,NeuralGCM 与现有其他 AI 模型性能相当,甚至更好;
-
加入海平面温度后,NeuralGCM 的 40 年气候预测结果,与从 ECMWF 数据中发现的全球变暖趋势一致;
-
NeuralGCM 在预测气旋及其轨迹方面也超过了现有的气候模型。
值得一提的是,NeuralGCM 不仅在准确度方面达到甚至超过了现有传统数值天气预报模型和其他机器学习(ML)模型;在速度上也是“遥遥领先”,可以在
30 秒计算时间内生成 22.8 天大气模拟
;且可以比传统模型节省数量级的计算量。
视频|NeuralGCM 模拟大气的速度比最先进的物理模型更快,同时生成的预测结果精确度相当。该视频比较了 NeuralGCM 与 NOAA X-SHiELD、NCAR CAM6 两种物理模型在 30 秒计算时间内生成的大气模拟天数。其中,NOAA X-SHiELD 是一个高分辨率(0.03°)物理模型,必须在超级计算机上运行;NCAR CAM6 则是一个分辨率较低(1.0°)的纯大气物理学模型,由于计算成本较低,是科学家们更常用的选择。虽然 NeuralGCM 运行的分辨率较低(1.4°),但其精度与较高分辨率的模型相当。(来源:Google Research)
相关研究论文以
“Neural general circulation models for weather and climate”
为题,已发表在权威科学期刊
Nature
上。
这些结果共同表明,NeuralGCM 可以生成确定性天气、天气和气候的集合预报,在长期天气和气候模拟方面显示出了足够的稳定性。
研究团队认为,这种端到端深度学习与传统大气环流模型(GCM,表征大气、海洋和陆地的物理过程,是天气和气候预测的基础)所执行的任务是兼容的,且能够增强对理解和预测地球系统至关重要的大规模物理模拟。
此外,NeuralGCM 的混合建模方法还可以应用于其他科学领域,比如材料发现、蛋白质折叠和多物理工程设计等。
减少长期预报的不确定性以及估算极端天气事件,是理解气候缓解和适应的关键。
ML 模型
一直被认为是天气预测的一种替代手段,具有节省算力成本的优势,甚至在确定性天气预报方面已经达到或超过了大气环流模型的水平,但
在长期预报的表现常常不如大气环流模型
。
在这项工作中,研究团队结合机器学习和物理方法设计了 NeuralGCM,利用 ML 组件替换或校正 GCM 中的传统物理参数化方案,由以下几个关键部分组成:
-
可微分的动力核心
:该核心负责求解离散化的动力方程,模拟大尺度流体运动和热力学过程,受重力、科氏力和其他因素影响。动力核心使用水平伪谱离散化和垂直 sigma 坐标,并使用 JAX 库实现,支持自动微分。它模拟七个预报变量:水平风涡度、水平风散度、温度、地表压力和三种水物质(比湿、冰云水含量和液态云水含量)。
-
学习物理模块
:该模块使用 GCM 中的单柱方法,仅使用单个大气柱的信息来预测该柱内未解析过程的影响。它使用具有残差连接的全连接神经网络,并在所有大气柱之间共享权重。神经网络的输入包括大气柱中的预报变量、总入射太阳辐射、海冰浓度和海表温度,以及预报变量的水平梯度。神经网络的输出是预报变量趋势,按目标字段无条件标准差进行缩放。
-
编码器和解码器
:由于 ERA5 数据存储在压力坐标中,而动力核心使用 sigma 坐标系统,因此需要编码器和解码器进行转换。这些组件执行压力水平和 sigma 坐标水平之间的线性插值,并使用与学习的物理模块相同的神经网络架构进行校正。编码器可以消除初始化冲击引起的重力波,从而避免污染预测结果。
图|NeuralGCM 模型架构。
NeuralGCM 结合了传统的流体动力学求解器和用于小尺度物理的神经网络。
这些组件由微分方程求解器组合而成,在时间上依次向前推进系统。
(来源:
Google Research)
结果显示,NeuralGCM 在天气预测方面展现出强大的能力,在超短期、短期和中期时间尺度上与最先进的模型相媲美。如下:
超短期预测(0-1 天)
短期预测(1-10 天)
-
准确性:在 1-3 天的短期预测中,NeuralGCM-0.7° 和 GraphCast 的表现最佳,准确追踪天气模式的变化。
-
物理一致性:与其他机器学习模型相比,NeuralGCM 的预测更加清晰,避免了物理上不一致的模糊预测。
-
可解释性:通过诊断降水减去蒸发,NeuralGCM 的结果更具可解释性,方便进行水资源分析。
-
地转风平衡:与 GraphCast 相比,NeuralGCM 更准确地模拟了地转风和地转风的垂直结构及其比率。
中期预测(7-15 天)
此外,除了在天气预测方面表现出色,NeuralGCM 在气候模拟方面也展现出了强大的能力,表现在季节循环模拟、热带气旋模拟和历史温度趋势模拟等方面。如下:
季节循环模拟
热带气旋模拟
视频|NeuralGCM 预测了 2020 年全球热带气旋的路径。
预测结果与 ECMWF 再分析第 5 版(ERA5)数据集显示的当年实际气旋的数量和强度相吻合。
(来源:
Google Research)
历史温度趋势模拟
-
AMIP 模拟:NeuralGCM-2.8° 进行了 40 年的 AMIP 模拟,结果表明,所有模拟均准确地捕捉了 ERA5 数据中观察到的全球变暖趋势,并且年际温度趋势与 ERA5 数据具有强相关性,表明 NeuralGCM 能够有效地模拟海温强迫对气候的影响。
-
与 CMIP6 模型的比较:与 CMIP6 AMIP 模型相比,NeuralGCM-2.8° 在 1981-2014 年期间的温度偏差更小,即使在消除了 CMIP6 AMIP 模型的全球温度偏差之后,这一结果仍然成立。
图|NeuralGCM 在十年时间尺度上的准确性和捕捉全球变暖的能力。
NeuralGCM 和 AMIP 在预测 1980 年至 2020 年全球平均气温方面的表现比较。
(来源:
Google Research)
尽管 NeuralGCM 在天气和气候预测方面展现了强大的能力,但它
仍然存在一些局限性
。
首先,
NeuralGCM 预测未来气候的能力有限
。NeuralGCM 目前无法预测与历史气候明显不同的未来气候。当海表温度(SST)增加幅度较大时(比如 +4K),NeuralGCM 的响应与预期不符,并出现气候漂移现象。
其次,
NeuralGCM 模拟未观测气候的能力不足
。与其他机器学习气候模型类似,NeuralGCM 也面临着模拟未观测气候的挑战,比如未来气候或与历史数据差异较大的气候。这需要模型具备更强的泛化能力,以及更先进的训练策略,比如对抗训练或元学习。
然后,
NeuralGCM 还存在物理约束和数值稳定性问题
。例如,NeuralGCM 的谱分布仍然比 ECMWF 物理预报模糊,且在模拟热带极端事件方面存在低估现象。这需要进一步研究和改进模型的物理过程参数化和数值方法,以提高模型的物理一致性和数值稳定性。
最后,
缺乏与其他地球系统组件的耦合
。目前 NeuralGCM 仅模拟大气系统,而气候系统是一个复杂的相互作用系统,包括海洋、陆地、冰雪和生物圈等。要进行更全面的气候模拟,NeuralGCM 需要与这些组件进行耦合,并考虑它们之间的相互作用。这需要开发新的模型架构和训练策略,以实现多物理场耦合模拟。