现有的科学研究存在两种基本范式,分别是基于大量数据归纳的开普勒范式和基于物理建模演绎的牛顿范式。但随着维数的增加,计算量呈现指数增长的趋势。一方面,数据驱动的路径面临着缺乏数据及数据分析工具的困境,另一方面,从模型驱动角度看,解决实际问题的过程总是陷入精度和速度难以两全的纠结中。中国科学院院士鄂维南认为,“无论从数据驱动的角度,还是从模型驱动的角度,人工智能都有巨大的发展空间。”
近年来,以机器学习,尤其是深度网络神经为代表的 AI 技术发展提供了破局的新思路和新方法。对于大量复杂的高维函数而言,作为特殊函数的深度神经网络可以进行有效拟合逼近,不仅提供了行之有效的数据分析方法,也能对海量数据的高效模拟实现尺度和精度的“两手抓,两手都要硬”。
2018年,鄂维南院士在全球首次提出“AI for Science”概念,强调利用 AI 学习科学原理、创造科学模型来解决实际问题,使之成为科学研究的新范式。目前,AI for Science 已得到国内外学界和业界的普遍认可。
国际上, Elon Musk 官宣 x.ai,其理念为“建立理解自然规律的人工智能系统 (understand the true nature of the universe)”;前谷歌掌门人 Eric Schmidt 宣布捐出1.48亿美元成立 AI for Science 博后奖学金,已布局9所大学;微软宣布成立专门的 AI4science 部门;英伟达联合 IIT 发布 AI for Science 公开课程;龙头药企赛诺菲宣布 “all-in” AI for (life) science;美国能源部联合5大国家实验室发布 AI for Science, Energy & Security 先进科研课题指引;OECD 面向全球政策制定者发布 AI in Science 的综述与政策建议 ...... 从学界到业界,从产业到政府,全球范围的 AI for Science 角力已然开始。
在国内,2023 年科技部会同自然科学基金委启动“人工智能驱动的科学研究”(AI for Science)专项部署工作,布局“人工智能驱动的科学研究”前沿科技研发体系。科技创新2030—“新一代人工智能”重大项目也将 AI for Science 作为人工智能的重要发展方向进行安排。在指南中,部署了“重大科学问题研究的AI范式”任务,面向地球科学、空间科学、化学和材料科学、生物医药科学等领域重大科学问题开展创新研究。同时,面向国际竞争激烈的蛋白质结构预测领域,支持国内优势团队开展科研攻关。在平台支撑方面,科技部正在加快推动公共算力开放创新平台建设,将为 AI for Science 发展打造智能算力基座。
事实上,AI for Science 结合机器学习拟合高维函数的强大能力,推动科学研究从单打独斗的“小农作坊”模式走向“安卓模式”的平台科研,直面产业需求,通过规模化和去中心化的测试加速科研和产业的对接,大大提升科研效率和生产力。“要实现安卓模式,需要把科学计算流程抽象化和标准化。”鄂维南院士曾表示,大家共同建设大平台,共享基本的模型、算法、数据库和知识库等基础设施,在此基础上开发各自团队感兴趣的应用,通过“滚雪球效应”加速科研创新和成果应用。