各位客官老爷,经过整个4月的积累和检验,我们最新一期的预报检验结果新鲜出炉了。本轮战报包含3种数值天气预报、5种气象大模型预报检验结果,他们是:
数值模式:
-
GFS(NOAA)
-
TW-GFS(台湾气象局数值模式)
-
IFS(ECMWF)
气象大模型:
AIFS和GraphCastGFS来自于两者官方数据源。
伏羲、FourCastNet、GraphCast三种大模型由我司独立运行
,在之前的检验中由于计算资源有限GraphCast只运行了72小时预报,4月我们下了血本购置了更充足的计算资源,所有自运行大模型均输出120小时预报结果。再次感谢云侧科技(北京)有限公司在大模型运行过程中提供技术支持。
检验要素:
降水、2米温度、10米风速
检验时段:
2024.4.1 - 2024.4.30 所有预报产品每日4次(UTC00、06、12、18)预报结果
检验步长&时效:
每种产品检验6-120小时逐6小时预报效果
检验点位:
2000+中国国家地面气象站点位(具体台站数量和位置,请参考国家气象科学数据中心官网)
检验方法:
-
降水检验:晴雨TS评分
-
其他要素:平均绝对误差(MAE)
好了,下面进入干货部分,为大家揭示4月八种预报产品的预报效果,一起看看神经网络和数理模型的碰撞结果:
降水预报效果,大致分成三个梯队:
第一梯队:GFS、IFS、TW-GFS、伏羲
第二梯队:AIFS、FourCastNet
第三梯队:GraphCastGFS、GraphCast
在第一梯队的角逐中,6-12小时预报GFS略占优势,IFS在18-90小时预报时效内一直保持着稳定的领先优势,GFS和TW-GFS在18-60小时预报时效内难分伯仲。而同在第一梯队的伏羲在60小时之前与其他三种产品有一定的差距,而在60小时之后逐步追上并超越了GFS与TW-GFS,并在90小时后超越IFS的预报效果。
AIFS和FourCastNet属于第二梯队,在6-78小时AIFS略胜于FourCastNet,之后两者的预报技巧交替领先。值得注意的是,在90小时之后TW-GFS已经逐渐逊于AIFS和FourCastNet。较长时效的预报,第一第二梯队的差距不大。
第三梯队是同样选择图神经网络作为技术路线的两个大模型GraphCastGFS和GrapchCast,在6-90小时预报中NOAA版GraphCast略胜出使用ERA5驱动的原生版GraphCast,但笔者觉得两者几乎是同一个水平。
八种产品的温度预报效果相对比较分散,没有明显的梯队之分。TW-GFS的温度预报MAE几乎在全时段内表现最差,NOAA系的数值模式GFS和大模型GraphCastGFS略胜于TW-GFS。IFS的温度预报没有其在降水预报上的亮眼表现,而其自家的大模型AIFS以绝对优势在温度预报上拔得头筹。伏羲的温度预报表现依旧出色,虽然在6-12小时内略逊于GrapchCast,但在更长时效的预报上稳居第二。FourCastNet的温度预报表现平平,处于中游水平。
值得关注的是:在温度预报上,5种大模型中的4种都有着较好的表现,数值模式中的最优者IFS相比这4种大模型也略有逊色。
风速预报上八种产品的预报效果更为接近,其中伏羲表现亮眼,6-12小时与GraphCast打成平手,其它时效均胜出。GraphCast和IFS的风速预报有着较为接近的表现,略逊色于伏羲。TW-GFS紧随其后,除36-60小时预报时效内与FourCastNet和AIFS有所交叉之外,其他时间略优于后者。NOAA系的数值模式GFS与大模型GraphCast只在6小时预报时效上和其他产品有所接近,其他时效均逊色于其他产品。
关于IFS在90小时之后的预报技巧波动,来自IFS的业务逻辑导致的检验样本波动,为了保证检验的公平公正没有对数据进行修正,请大家90小时后关注IFS的预报技巧变化趋势。
EC的数值模式在降水预报上依旧有其独到之处,大模型在降水预报上仍有差距。温度和风速预报上,大模型都打出了漂亮战绩,AIFS和伏羲分别摘得桂冠。而NOAA系的数值模式和大模型,在温度和风速预报中表现整体偏弱。
4月华南地区经历了多次持续的暴雨过程,我们也非常关注。将在近期针对华南地区的多次暴雨过程进行预报检验分析,看一看数值模式和气象大模型在暴雨天气过程中的表现如何,敬请期待!
声明:
欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编
(微信:qxxjgzh)
处理。