---------------
Earth System Foundation Model 是地球系统的AI大模型。
每个大的数值模拟中心应该有自己的
Earth System Foundation Model。
或者拥有
Earth System Foundation Model的中心会成长为新的大中心。
Earth System Foundation Model 与数值模拟的地球系统模式(Earth System Model)不是相互取代,而是相得益彰。
中国应该发展自己的
Earth System Foundation Model。
-----------------
(图片由ChatGPT-4o生成)
简单而言,与之前的AI模型相比,
Foundation model是在海量,多样的数据上,不针对特定目的而训练的,具有多模态能力的AI大模型
。最直观的例子就是对比transformer模型和去年以来大火的ChatGPT。
除了ChatGPT为代表的大语言模型(Large language model),千行百业基于自身特性和需求,发展自己领域的Foundation model,已是百舸争流。
比如在AI领域积淀多年的医药领域。医学领域基于常年积累的海量的影像标记数据,AI应用一直独领风骚。比如,ChatGPT发布(2022.11.30)不久,斯坦福大学一个小组就在nature上发表perspective,畅想
generalist medical AI (GMAI) (
Foundation models for generalist medical artificial intelligence.
Nature
616
, 259–265 (2023)
)。
而最近,已涌现出大量的真实可用的产品,比如
Prov-GigaPath(
A whole-slide foundation model for digital pathology from real-world data.
Nature
630
, 181–188 (2024).
)。
以及我们都想要取的名字
PathChat
(
A Multimodal Generative AI Copilot for Human Pathology.
Nature
(2024))
基于地球科学领域积累的海量数据发展
Earth System Foundation Model,情理之中,也早有共识。比如在预印本网站上贴出的这篇文章
Aurora: A Foundation Model of the Atmosphere
很多地学中心也在这个方向紧锣密鼓地布局,比如下面这则招聘公告:
-------------
我们为什么需要Earth System Foundation Model?我只能列一些我的观点:
首先,我们有Earth System Model,为什么还需要Earth System Foundation (AI) model?地球系统科学借助地球系统模式,在过去探索出了一条与其他科学迥异的发展之路。我们在骄傲于我们可以通过物理公式模拟地球这个复杂的系统的同时,我们也困惑于越来越复杂的模型已难以通过物理公式直接解释。复杂系统自身的混沌效应已越来越多的阻滞我们理解过去的气候,预测未来的气候。我们对物理的理解也无法修正这个庞然大物显现出的各类偏差。所以,问题越来越多的变成:
不是我们不理解这个世界,我们不理解这个模型。
而问题的根源在于,数值模型模拟出一堆大数据,而人脑可能无法从海量数据里快速获取信息。但AI大模型因数据而生。所以
Earth System Foundation Model可能比不来人类理解这个世界,但却可以超越人类理解这个模型。
因此我们说,
Earth System Foundation Model 与数值模拟的Earth System Model不是相互取代,而是相得益彰。
其次,
Earth System Foundation Model 可以推动AI在地球系统科学研究中的应用进入新的范式。相较于传统应用研究中为某个特定目标开发的AI算法,比如预测ENSO指数的AI算法,
Earth System Foundation Model本身具有地球系统的知识。 鉴于任何地球科学问题都是一个系统问题,这种具有具有系统知识的AI模型将显现更大的潜力。
最后,仍然回到可解释性的问题。这仍然会是一个问题。我们经典的科研总是
数据---信息---知识
。为了让信息变成可靠的知识,我们需要反复地验证,需要可靠的解释。但也有很多场景,我们只是无法获取足够的信息。比如ICON的模拟结果显著地低估了ENSO的强度。这个信息是很容易获得的。但是是模型里哪里出了问题使得ICON低估了ENSO的强度,这样的信息却很难获得。所以
即使我们基于物理的地球系统模式不是一个黑箱,它至少是个灰箱
。而AI是个彻彻底底的黑箱,但现在它是一个左边可以比人类更彻底地理解地球系统模式这个灰箱,右边可以跟人类通过自然语言进行交流的黑箱。所以摆脱AI是个算法,拥抱AI是个copilot的新范式,才是
Earth System Foundation Model助力地球系统科学发展的新路子。也有很多场景,我们不需要解释。比如预测,越准越好,但尽AI事,不计天命。
--------
最后,为什么中国需要自己的
Earth System Foundation Model。
Foundation model 不是算法问题,而是工程问题。它需要人才,更需要基建。国内基于CPU跑数值模式的超算集群显然训练不来
Earth System Foundation Model。所以需要更高层次的支持。如果今天特意召开一个AI与地球系统科学发展的会议,讨论的议题还是“AI与资料同化”这样的话题,显然缺少一些更宏观的布置。
Earth System Foundation Model也面向未来经济——我们立志于一个更加绿色可持续的未来生活方式,我们也面对一个更加极端低预测的未来天气。
Earth System Foundation Model也会提供更多话语权。
当下的AI可能还无法满足你我对AI的想象。但超越你我想象的AI总会到来。当那一天真的来临的时候,我希望我们可以说,“好,换一下模型”。
(封面由ChatGPT-4o生成)
(转载请注明出处,这里是
全真地球
)