主要观点总结
本文报道了Google DeepMind提出的GenCast模型在天气预报领域的突破性进展。GenCast是一种基于机器学习的概率天气模型,能够在短时间内生成高分辨率的全球天气预报。该模型在多个目标评估中表现出比现有集合预报更高的预测准确性,特别是在极端天气事件的预测中更为出色。文章还讨论了GenCast的技术细节及其对未来天气预报的潜在影响。
关键观点总结
关键观点1: GenCast模型的出现
Google DeepMind提出了GenCast模型,这是一种基于机器学习的概率天气模型。
关键观点2: GenCast模型的特点
GenCast能够在短时间内生成分辨率为0.25°的全球15天预报,预测误差比单一数值天气预报模型更小。
关键观点3: GenCast模型的性能表现
在团队评估的1,320个目标中,GenCast显示出比ENS更稳健的预测,并能更好地预测极端天气、热带气旋轨迹和风力发电。
关键观点4: GenCast模型的技术细节
GenCast使用扩散模型,这是一种生成式ML方法,可以对复杂数据的概率分布进行建模并生成新样本。它通过迭代细化过程进行工作,每个时间步骤都使用噪声初始化,然后使用不同的噪声样本重复该过程以生成轨迹集合。
关键观点5: GenCast模型的影响和未来展望
GenCast的出现为实用天气预报开启了新的篇章,关键的天气相关决策将更加准确和高效。展望未来,GenCast可以通过多种方式进一步改进其运行设置,如提高分辨率、探索提炼和其他效率技术,以及使用操作数据进行微调。
正文
来源:ScienceAI
全球顶尖天气预报系统被AI击败,DeepMind新模型登Nature,8分钟搞定未来15天预测
天气预报从根本上来说具有不确定性,因此预测可能发生的天气情景范围对于重要决策至关重要,从警告公众注意危险天气到规划可再生能源的使用。
传统上,天气预报基于数值天气预报 (NWP),它依赖于基于物理学的大气模拟。基于机器学习 (ML) 的天气预报 (MLWP) 的最新进展产生了基于 ML 的天气模型,其预测误差比单一 NWP 模拟要小。
但是,这些进展主要集中在单一的确定性预测上,这些预测无法反映不确定性和估计风险。总体而言,MLWP 的准确性和可靠性仍然低于最先进的 NWP 集合预报。
Google DeepMind 的研究人员提出了 GenCast,这是一种概率
天气模型,其技巧和速度比世界上顶级的中期天气预报、ENS(欧洲中期天气预报中心的集合预报)更高。
GenCast 是一种机器学习天气预报方法,基于数十年的再分析数据进行训练。GenCast 可在 8 分钟内生成一组随机的 15 天全球预报,步长为 12 小时,经纬度分辨率为 0.25°,涵盖 80 多个地表和大气变量。
在团队评估的 1,320 个目标中,有 97.2% 的目标显示出比 ENS 更稳健的预测,并且能更好地预测极端天气、热带气旋轨迹和风力发电。
这项工作有助于开启实用天气预报的下一篇章,其中关键的天气相关决策将更加准确和高效。
该研究以「Probabilistic weather forecasting with machine learning」为题,于 2024 年 12 月 4 日发布在《Nature》。
天气预报在日常生活中发挥着重要作用,协助人们在生产生活中做出关键决策。但是,由于当前天气部门只能部分观测气候,且气象模型存在不完美性,预报总是带有不确定性。
传统的数值天气预报(NWP)方法通过求解大气动力学方程来预测天气,而集合预报(ENS)则通过生成多个预报情景来描述未来可能的天气情况。尽管集合预报能够提供更为精准的概率分布,但它仍存在误差大、计算慢且执行工程复杂等问题。
最近,基于机器学习的天气预报(MLWP)方法,在非概率性预报方面已经表现出比 NWP 更为精准和高效的性能。但是已有的方法通常侧重于预测概率轨迹的均值而非不确定性,并且在长时间预报中效果较差。某些混合 NWP-MLWP 方法如 NeuralGCM 在性能上与传统集合预报相当,但空间分辨率较低。
在最新的研究中,Google DeepMind 的研究人员
提出了 GenCast,这是一种全新的 MLWP 方法,其性能明显优于顶级集成 NWP 模型 ENS。它可以生成逼真的单个天气轨迹集成,提供比 ENS 更好的边际预报分布和联合预报分布。
GenCast 是一种概率天气模型,
可生成分辨率为 0.25° 的全球 15 天集合预报,其准确度高于顶级业务集合系统 ECMWF 的 ENS。在 Cloud TPUv5 设备上生成单个 15 天 GenCast 预报大约需要 8 分钟,并且可以并行生成一组预报。
GenCast 根据当前和之前的天气状态对未来天气状态 Xt+1 的条件概率分布 P(Xt+1|Xt, Xt−1) 进行建模。长度为 T 的预测轨迹 X1:T 以初始状态和之前的状态 (X0, X−1) 为条件,并分解连续状态
的联合分布,每个状态都以自回归方式采样。
全球天气状况 X 的表示由等角 0.25° 纬度-经度网格上的 13 个垂直气压水平上的六个地表变量和六个大气变量组成。预报期为 15 天,连续步骤 t 和 t + 1 之间间隔 12 小时,因此 T = 30。
研究人员使用 X 的分析来训练 GenCast,它代表了从观测中推断出的天气状况的最佳估计值。
GenCast 是一种条件扩散模型,它是一种生成式 ML 方法,可以对复杂数据的概率分布进行建模并生成新样本。扩散模型是生成式 AI 领域中许多最新自然图像、声音和视频建模进展的基础。扩散模型通过迭代细化过程进行工作。未来的大气状态 Xt+1 是通过迭代细化候选状态(初始化为纯噪声
)而产生的,该候选状态以之前的两个大气状态(Xt、Xt-1)为条件。
图 1 中的蓝色框显示了如何从初始条件生成第一个预测步骤以及如何自回归生成完整轨迹 X1:T。由于预测中的每个时间步骤都用噪声初始化,因此可以使用不同的噪声样本重复该过程以生成轨迹集合。
图 1:GenCast 如何产生预测的示意图。(来源:论文)
在迭代细化过程的每个阶段,GenCast 都会使用降噪神经网络,该网络经过训练,可使用论文中描述的损失函数消除人为添加到大气状态中的噪声。降噪器的架构包括编码器、处理器和解码器。
GenCast 是基于 1979 年至 2018 年 40 年的最佳估计分析进行训练的,这些分析取自公开可用的 ERA5(第五代 ECMWF 再分析)再分析数据集。
再分析通过计算历史日期和时间的分析来重建过去的天气。在评估 GenCast 时,研究人员使用 ERA5 分析对其进行初始化。
图 2:预报和热带气旋路径的可视化。(来源:论文)
作为一个说明性示例,图 2 b-d、h-j 展示了 GenCast 预测样本,图 2 n-q 提供了一个示例,说明如何将它们用于重要的下游应用,例如预测热带气旋的路径。台风哈吉比斯(2019 年最昂贵的热带气旋)是一个代表性案例研究。
在台风哈吉比斯登陆前 7 天初始化时,GenCast 预测的轨迹表现出较高的不确定性,涵盖了多种可能情景。在较短的预测时间内,GenCast 对气旋路径的不确定性较低,反映出对登陆时间和地点的信心更高。
研究人员进行了一系列评估,结果表明,基于 MLWP 的概率天气预报比顶级的基于 NWP 的集合预报 ECMWF 的 ENS 更熟练、生成速度更快。GenCast 在概率天气模型的三个关键要求方面取得了成功:
首先,GenCast 会生成具有真实功率谱的清晰单个天气轨迹集合,而不是条件均值等汇总统计数据集。
图 3 :GenCast 的边际预测分布非常巧妙且经过良好校准。(来源:论文)
其次,GenCast 的边际预报分布(即针对给定地点和时间的预报)经过精心校准,可提供比 ENS 更精准的预报,包括对极端事件的更准确预报。
第三,GenCast 在几项需要捕捉联合分布中的空间和时间依赖性的评估中表现优于 ENS:汇集评估、区域风电预测和热带气旋路径预测。
图 4:GenCast 在区域风力和热带气旋路径预测方面优于 ENS。(来源:论文)
展望未来,GenCast 可以通过多种方式进一步改进其运行设置。GenCast 的分辨率为 0.25°,这是目前全球再分析数据的最大分辨率。但是,将其扩展到更高的分辨率以支持更多应用并匹配升级后的 ENS 分辨率(截至 2023 年中)0.1° 可能会很有用。
作为一种扩散模型,GenCast 在计算上比等效的确定性 MLWP 架构更昂贵,因为它需要多个函数评估来对每个预测时间步进行采样。
为了有效地扩展到更高的分辨率或朝着与 GenCast-Perturbed 和类似模型的计算平价迈进,应该探索提炼和其他效率技术。
此外,先前的研究表明,通过使用操作数据(例如 HRES 分析输入和目标)进行微调,可以进一步提高在再分析上训练的 MLWP 模型的性能。这强调了传统基于 NWP 的数据同化对于 GenCast 提供训练和初始化数据的重要性。
总之,这项研究结果开辟了天气预报的新领域,有望在各种环境下提高准确性、效率和可访问性。
更广泛地说,该工作证明,尖端的生成式人工智能方法可以捕捉丰富的时间动态中非常高维和复杂的分布,具有足够的准确性和可靠性,从而支持关键应用中的有效决策。
论文链接:
https://www.nature.com/articles/s41586-024-08252-9
阅读报告全文,请访问欧米伽研究所的“未来知识库”
https://wx.zsxq.com/group/454854145828
未来知识库
是“
欧米伽
未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。
目前拥有超过8000
篇重要资料。
每周更新不少于100篇世界范围最新研究
资料
。
欢迎扫描二维码或访问
https://wx.zsxq.com/group/454854145828
进入。
截止到11月25日 ”未来知识库”精选的100部前沿科技趋势报告
-
Air Street Capital《2024 年人工智能现状报告》
-
未来今日研究所:2024 技术趋势报告 - 广义计算篇
-
科睿唯安中国科学院 2024 研究前沿热度指数报告
-
文本到图像合成:十年回顾
-
《以人为中心的大型语言模型(LLM)研究综述》
-
经合组织 2024 年数字经济展望报告加强连通性创新与信任第二版
-
波士顿咨询 2024 全球经济体 AI 成熟度矩阵报告
-
理解世界还是预测未来?世界模型的综合综述
-
Google Cloud CSA2024 AI 与安全状况调研报告
-
英国制造商组织 MakeUK2024 英国工业战略愿景报告从概念到实施
-
花旗银行 CitiGPS2024 自然环境可持续发展新前沿研究报告
-
国际原子能机构 2024 聚变关键要素报告 - 聚变能发展的共同愿景
-
国际可再生能源署 IRENA2024 年全球气候行动报告
-
Cell: 物理学和化学 、人工智能知识领域的融合
-
智次方 2025 中国 5G 产业全景图谱报告
-
未来今日研究所:2024 技术趋势报告 - 移动性,机器人与无人机篇
-
Deepmind:AI 加速科学创新发现的黄金时代报告
-
PitchBookNVCA2024 年第三季度全球风险投资监测报告
-
德科 2024 年未来全球劳动力报告
-
高工咨询 2024 年协作机器人产业发展蓝皮书
-
国际能源署 IEA2024 年全球能源效率报告
-
基因慧基因行业蓝皮书 2024 - 2025
-
普华永道 PwC2024 全球经济犯罪调查英国报告 - 智对风险直面挑战
-
中国互联网协会 2024 面向未来网络的数字孪生城市场景应用白皮书
-
中移智库 2024 先进感知新技术及新应用白皮书
-
智次方研究院 2025 中国 AIoT 产业全景图谱报告
-
未来今日研究所:2024 技术趋势报告 - 人工智能篇
-
国际电联:迈向衡量数字经济的通用框架的路线图
-
联合国粮食与农业组织:2024 年世界粮食安全和营养状况
-
大语言模型综述
-
李飞飞等,AI 智能体:探索多模式交互的前景综述
-
哈尔滨工业大学 - ChatGPT 调研报告
-
2024《美国核部署战略报告》最新文件
-
清华大学:AIGC 发展研究 3.0 发布版 b 版
-
OpenAI:2024 年 OpenAI o1 大模型技术报告
-
Verizon2024 年世界支付安全报告
-
皇家学会哲学学报 从复杂系统角度评估人工智能风险
-
复旦大学 大模型 AI 代理的兴起和潜力:综述
-
经合组织 OECD2024 年气候行动监测报告
-
Wevolver2024 年边缘人工智能现状报告 - 探索各行业边缘 AI 应用动态
-
2024 全球人形机器人产品数据库报告 - 人形机器人洞察研究 BTIResearch
-
《全球金融稳定报告》 把舵定航 不确定性、人工智能与金融稳定
-
瑞士洛桑联邦理工学院 《人工智能中的 - 创造力:进展与挑战》
-
《你所需要知道的理 - 论:人工智能、人类认知与决策》牛津大学最新 53 页报告
-
世界经济论坛 新兴技术时代的网络弹性导航:应对复杂挑战的协作解决方案 2024
-
ADL 理特咨询 2024 汽车出行未来展望报告
-
2024 中国硬科技创新发展白皮书 - 开辟未来产业新赛道
-
科学时代的大语言模型中的人工智能
-
Gartner2025 年重要战略技术趋势报告
-
CBInsights2024 年第三季度全球人工智能投融资状况报告
-
TrendHunter2025 年全球趋势报告 - 全行业顶级创新和变革趋势前瞻
-
天津大学 2024 大模型轻量化技术研究报告
-
欧洲海洋局 2024 导航未来报告将海洋置于更广泛的地球系统中第六版
-
美国安全与新兴技术中心 2024 AI 生成代码的网络安全风险研究报告
-
国际原子能机构 2024 年世界聚变展望报告
-
复旦大学 2024 大语言模型的能力边界与发展思考报告
-
安盛 AXA2024 年气候与生物多样性报告气候过渡计划路线图
-
YouGov2024 美国公众对人工智能 AI 的态度调研报告
-
麦肯锡中国报告:《中国与世界》完整版