专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
数据派THU  ·  Science正刊|蛋白质语言模型EVOLV ... ·  3 天前  
软件定义世界(SDX)  ·  南方电网:调度运行领域电力人工智能应用 ·  6 天前  
数据派THU  ·  顶刊速看:《NATURE ... ·  1 周前  
51好读  ›  专栏  ›  数据派THU

「颠覆性」科学没有衰落,谷歌 AI 推动科学发展的 9 种方式

数据派THU  · 公众号  · 大数据  · 2024-12-06 17:00

正文

来源:ScienceAI

本文约3300字,建议阅读6分钟

谷歌回顾了其最近发布的九个 AI for Science 研究。



科学在不断进步,但进步的速度似乎放缓了?


正如《Nature》曾报道称,「颠覆性」科学已经衰落,没有人知道原因......


但就在过去几年里,人工智能和量子计算等新兴领域的突破,大大加快了科学发现的速度。从医疗保健到新材料发现。


谷歌始终走在 AI for Science 的最前沿,从蛋白结构预测 AI 工具 AlphaFold 到材料发现系统 GNoME,从天气预报系统 NeuralGCM、GraphCast 到数学几何推理模型 AlphaGeometry......


接下来,谷歌回顾了其最近发布的九个 AI for Science 研究,探索了他们如何走到今天以及下一步该怎么做。


01、破解 50 年来的「大挑战」——蛋白质结构预测


几十年来,科学家们一直将揭开蛋白质折叠之谜视为「大挑战」。


今年,化学诺奖花落「AI+蛋白」,Google DeepMind 的科学家 Demis Hassabis 和 John M. Jumper 分享一半,以表彰他们在「蛋白质结构预测」方面的贡献。


从 AlphaFold 更新到如今的 AlphaFold 3,一起回顾谷歌在「AI+蛋白」领域的研究和突破。



2021 年,谷歌 DeepMind 与欧洲生物信息研究所(EMBL-EBI)合作发布了 AlphaFold DB,利用 AlphaFold 预测确定 98.5% 所有人类蛋白结构,相关研究登上《Nature》。


2022 年,谷歌 DeepMind 分享了其 AlphaFold 2 模型中 2 亿种蛋白质的预测结构。以前,确定单个蛋白质的 3D 结构通常需要一年或更长时间,AlphaFold 可以在几分钟内以惊人的准确度预测这些形状。通过在免费数据库中发布蛋白质结构预测,这使得世界各地的科学家能够加速开发新药、对抗抗生素耐药性和解决塑料污染等领域的进展。


作为下一步,AlphaFold 3 模型以 AlphaFold 2 为基础,预测所有生命分子的结构和相互作用。2024 年 5 月,AlphaFold 3 重磅问世,全面预测蛋白质与所有生命分子相互作用及结构,准确性远超以往水平。但 AlphaFold 3 发布的时候,谷歌 DeepMind 没有公布其论文代码,因此引发了学界的巨大争议。


前不久(11 月 11 日),AlphaFold 3 开源了,科学家现在可以免费下载软件代码,并将 AlphaFold 3 用于非商业应用。AlphaFold 3 将结构生物学领域带入了新领域。


当然,挑战依然存在。该系统有时会在无序区域产生不正确的结构,并且只能预测静态结构而不是分子运动。下一步,AlphaFold 会不会能轻松「拿捏」动态分子?


02、以前所未有的细节展示人类大脑,支持健康研究


没有什么比人类大脑更神秘了。


谷歌在连接组学方面进行了长达 10 年的研究,与哈佛大学 Lichtman 实验室等机构合作,以前所未有的精细程度绘制了人类大脑的一小部分。


该项目于 2024 年发布,揭示了人类大脑中前所未见的结构。



研究人员共同创建了迄今为止最大的突触分辨率、3D 重建的人类大脑片段,以生动的细节展示了一块大约半米粒大小的人类颞叶皮层中的每个细胞及其神经连接网络。


谷歌将 Lichtman 的电子显微镜成像与 AI 算法相结合,对哺乳动物大脑极其复杂的线路进行颜色编码和重建。这一壮举登上了《Science》。


完整的数据集(包括每个细胞的 AI 生成的注释)已公开,来帮助加速研究。


数据集开源地址:
https://h01-release.storage.googleapis.com/landing.html


03、准确预报洪水,挽救生命


当谷歌的洪水预报项目于 2018 年启动时,许多人认为,由于数据稀缺,不可能大规模准确地提供洪水预报。但研究人员能够开发出一种 AI 模型,该模型能够可靠地预测未测量流域的极端河流事件,其预测时间长达五天,其可靠性与临近预报(nowcasts)相当。


2024 年 3 月,谷歌将这一覆盖范围扩大到全球 100 个国家和 7 亿人,并改进了 AI 模型,使其在七天内的准确度与之前在五天内的准确度相同。人工智能帮助我们提前 7 天提供更准确的河流洪水信息。



今年 7 月,谷歌团队提出一种将传统的基于物理建模与 ML 相结合的新方法——NeuralGCM,可以准确高效地模拟地球大气层。比现有模型更快、计算成本更低、更准确。


NeuralGCM 可以生成 2-15 天的天气预报,比目前基于物理的「黄金标准」模型更准确。相关研究登上《Nature》。


04、尽早发现野火,帮助消防员更快地扑灭野火


由于全球气候越来越炎热、干燥,野火变得越来越常见。到目前为止,消防员不得不依赖分辨率较低或每天仅更新几次的卫星图像,因此很难在火势发展到足球场那么大之前发现它们。


2024 年,谷歌研究与美国林业局合作开发了 FireSat,这是一种人工智能模型和新的全球卫星星座,专门用于通过在 20 分钟内提供高分辨率图像来检测和追踪教室大小(大约 5x5 米)的野火。这将使消防部门能够更快地做出反应,从而有可能挽救生命、财产和自然资源。



05、更快更准确地预测天气


天气影响着我们所有人。它可以决定我们早上的穿着,为我们提供绿色能源,在最坏的情况下,还会引发风暴。在极端天气日益增多的当今,快速准确的预报极其重要。


2023 年 6 月,谷歌团队开发了一个名为 MetNet-3 的新天气模型。它大大扩展了基于观察的神经模型可以预测的前置时间范围和变量。


MetNet-3 以早期的 MetNet 和 MetNet-2 模型为基础,可提前 24 小时对更多核心变量进行高分辨率预测,包括降水、表面温度、风速和风向以及露点。


与传统方法相比,MetNet-3 实现了强大的性能,优于最好的基于物理的单成员和多成员数值天气预报 (NWP) 模型,可提前 24 小时预报多个地区。


同年 11 月,Google DeepMind 推出并开源了机器学习研究模型 GraphCast 的代码,可以比行业黄金标准天气模拟系统 (HRES) 更准确、更快地提前 10 天预测天气状况。相关研究登上《Science》。


GraphCast 还可以更准确地预测气旋的轨迹(以及洪水等相关风险),并比传统模型提前三天准确预测飓风 Lee 将袭击加拿大新斯科舍省。



06、推进数学推理的前沿


由于缺乏数据和推理技能,人工智能一直在努力解决复杂数学问题。


在 2024 年,Google DeepMind 宣布推出 AI 系统 AlphaGeometry,可以解决复杂的几何问题,其水平接近人类国际数学奥林匹克 (IMO) 金牌得主——这是人工智能性能的突破,也是对更先进的通用人工智能系统的追求。


在对 30 道奥数几何题的基准测试中,AlphaGeometry 在标准奥数时限内解决了 25 道。相比之下,之前最先进的系统解决了其中 10 个几何问题,而人类金牌得主平均解决了 25.9 个问题。



随后,Gemini 训练的模型 AlphaGeometry 2 与新模型 AlphaProof 相结合,共同解决了过去 25 年所有 IMO 几何问题中的 83%。这展示了人工智能日益增强的推理能力,以及可能解决超出当前人类能力的问题的能力,使我们更接近能够发现和验证新知识的系统。


07、使用量子计算准确预测化学反应性和动力学


相互作用的多电子问题是科学领域最大的计算挑战之一,在许多领域都有着重要的应用。


谷歌与加州大学伯克利分校和哥伦比亚大学合作,在量子计算机上进行了迄今为止最大的化学模拟。该结果于 2022 年发表,不仅与经典方法相媲美,而且还不需要通常与量子计算相关的繁琐的误差缓解。进行这些模拟的能力将提供更准确的化学反应性和动力学预测,这是以新方式应用化学来帮助解决现实世界挑战的先决条件。


与流行的变分量子特征值求解器相比,该混合量子-经典计算模型为实现电子结构问题的实际量子优势提供了一另一种途径,而不需要极其精确地准备和测量基态波函数。


08、加速材料科学的发展


2023 年,谷歌 DeepMind 宣布推出新的 AI 工具——材料探索图网络 (GNoME),根据模拟结果,该工具已经发现了 380,000 种在低温下稳定的材料。


DeepMind 材料团队分享了 220 万颗新晶体的发现,相当于近 800 年的知识。GNoME 可通过预测新材料的稳定性来显著提高发现的速度和效率。


使用 GNoME,科学家可以使人类已知的技术上可行的材料数量成倍增加。在其 220 万个预测中,有 38 万个是最稳定的。这些候选材料中有潜力开发未来变革性技术,包括超导体、超级计算机供电和下一代电池等等。



与此同时,Google DeepMind 与加州大学伯克利分校的研究团队合作,开发了一个将机器人技术与 AI 相结合的自主新材料发现合成系统——A-Lab,可用于设计材料配方,其中包括一些可能用于汽车电池或太阳能电池的材料。它进行合成并分析产品的所有过程都无需人工干预。


09、向核聚变和丰富的清洁能源迈出重要一步


有一个老笑话,「核聚变是未来的能源——而且永远都是。」控制和使用为恒星(包括太阳)提供燃料的能量已经超出了科学的范围。



在 2022 年,谷歌 DeepMind 宣布开发出能够自主控制核聚变反应堆内等离子体的人工智能。通过与 EPFL 的瑞士等离子体中心合作,谷歌 DeepMind 建立了世界上首个可在模拟环境和真正的核聚变反应堆中实现对等离子体的自主控制的 AI 系统。朝着稳定聚变、为人类提供丰富的清洁能源迈出了关键的一步。


写在最后,AI 已经渗透到各科学领域,谷歌所取得的这些研究成果为即将到来的众多科学进步奠定了基础。


今年的诺奖颁发给 AI for Science,更是最强证明,AI 与 Science 是互补的未来。


参考内容:
https://blog.google/technology/ai/google-ai-big-scientific-breakthroughs-2024/
https://www.nature.com/articles/s41586-023-06735-9
https://www.nature.com/articles/s41586-021-04301-9
https://www.nature.com/articles/s41586-021-04351-z
https://www.nature.com/articles/s41586-023-06747-5
https://www.science.org/stoken/author-tokens/ST-1550/full
https://www.science.org/doi/10.1126/science.adk4858
https://www.nature.com/articles/s41586-024-07487-w
注:文中插图来自 google


编辑:于腾凯
校对:丁玺茗



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。



新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU