本文的标题是《ADVANCING DATA-DRIVEN WEATHER FORECASTING: TIME-SLIDING DATA AUGMENTATION OF ERA5》,是一篇关于数据驱动的天气预报的研究预印本。文章的作者们来自韩国科学技术院(Korea Institute of Science and Technology)的可持续环境研究中心(Center for Sustainable Environment Research)。文章的主要贡献在于提出了一种新的策略,该策略不依赖于通常的高分辨率数据,而是利用低分辨率数据(2.5度)进行全球天气预报和气候数据分析。
摘要
文章的摘要部分概述了研究的背景和主要贡献。现代深度学习技术已经在短短几年内引起了一场革命,这些技术模仿传统的数值天气预报(NWP)模型,并源自全球大气再分析数据。研究的重点在于评估数据驱动的天气预报(DDWP)框架,特别是样本大小的适当性、模型结构的改进,以及气候数据表示当前气候趋势的能力。通过使用自适应傅里叶神经算子(AFNO)模型和FourCastNet,以及提出的时间滑动方法来扩充ECMWF再分析v5(ERA5)的数据集,本文改进了传统方法,增加了更多的变量和一种新颖的数据增强和处理方法。研究结果表明,尽管分辨率较低,但所提出的方法在预测大气条件方面表现出相当的准确性,有效地与高分辨率模型相媲美。此外,研究证实了模型在反映当前气候趋势方面的熟练程度,以及其在预测未来气候事件方面的潜力,强调了其在气候变化策略中的实用性。这项研究标志着气象预报领域的一个重要步骤,展示了低分辨率数据在产生可靠预测方面的可行性,并为更易于访问和包容的气候建模开辟了途径。
引言
引言部分讨论了近年来深度学习模型在气候和天气建模中的采用趋势,这些模型在分析大型数据集方面表现出色,揭示了复杂的底层模式。然而,这些方法带来了一系列挑战,主要是由于这些模型所需的大量GPU计算能力和相关成本。处理高分辨率数据需要强大且资源密集型的计算基础设施,这往往导致了高昂的费用。因此,这些复杂模型的可扩展性和广泛适用性受到其对高分辨率数据源依赖的限制。
材料和方法
在材料和方法部分,作者详细描述了使用的数据集、FourCastNet模型、以及对原始模型进行的修改。数据集来自ECMWF Reanalysis v5(ERA5),包含了66个变量,以2.5度的水平分辨率结构化为张量。FourCastNet模型结合了傅里叶神经算子(FNO)方法和强大的Vision Transformer(ViT)骨干网络,擅长高效处理高分辨率数据。
修改部分
在修改部分,作者介绍了对原始FourCastNet框架的重大扩展,包括增加了更多的输入变量,改变了补丁大小,并对数据处理进行了改进。特别地,作者提出了一种新颖的数据增强方法,使用时间滞后的数据集,通过不同的24小时滑动窗口平均值来生成额外的日均数据集。
结果
结果部分展示了使用滞后数据的模型在预测2米温度(t2m)和500 hPa位势高度(z500)方面的准确性。模型使用滞后数据(lag4x)的结果在预测的初始阶段显示出显著较低的均方根误差(RMSE)和更高的异常系数相关性(ACC)分数。此外,作者还将提出的模型与其他现有方法进行了比较分析,展示了在不同预测时间步长下的性能。
结论
文章的结论部分总结了研究的主要发现,强调了模型结构改进对气候数据处理的显著影响,以及使用滞后数据进行数据增强的方法显著提高了模型性能。研究还证实了当前模型在捕捉和表示正在进行的气候变化趋势方面的有效性,并强调了扩大训练样本以包括当前和即将到来的气候条件的重要性。
这篇文章提供了对数据驱动天气预报的新视角,特别是在处理高分辨率数据计算资源受限的情况下,如何利用低分辨率数据进行有效的气候分析和预测。通过引入时间滑动数据增强方法,研究不仅提高了模型的预测准确性,也为气候变化策略的制定提供了有价值的见解。
注:本文由大模型解读。
声明:
欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编
(微信:qxxjgzh)
处理。