专栏名称: BioArt
BioArt致力于分享生命科学领域科研学术背后鲜为人知的故事,及时报道和评论生命科学领域有料的动态,BioArt也是一个生命科学领域“百花齐放,百家争鸣”的舞台,循“自由之思想”与“独立之精神”为往圣继绝学。
目录
相关文章推荐
BioArt  ·  Cell Metab | ... ·  4 天前  
生信宝典  ·  综述 | ... ·  6 天前  
51好读  ›  专栏  ›  BioArt

Nature | 王童团队开发AI²BMD实现AI驱动的量子精度蛋白质动力学模拟

BioArt  · 公众号  · 生物  · 2024-11-12 00:08

正文


生物世界的本质在于其分子及其相互作用的不断变化。理解生物分子的动力学和相互作用对于解读生物过程背后的机制以及开发生物材料和药物至关重要。正如理查德·费曼(Richard Feynman)的名言:“生物所做的一切都可以从原子的跳动和摆动来理解。”然而,通过实验捕捉这些真实的运动过程是极为困难的。


近年来,随着以AlphaFold和RoseTTAFold为代表的深度学习方法的发展,对静态晶体蛋白质结构的预测已经达到了实验精度并获得了今年的诺贝尔化学奖。然而,在原子分辨率下准确表征生物分子的动力学特征显然更具挑战性,特别是当蛋白质发挥其作用并与其他生物分子或药物分子相互作用时。分子动力学(MD)模拟将物理定律与数值模拟相结合,已被广泛用于探索分子运动与其生物功能之间的关系。分子动力学模拟大致可分为两类:经典分子动力学模拟和量子力学模拟。当经典分子模拟在2013年获得诺贝尔奖时,其对理解复杂生物系统的关键作用的重要性就得到了凸显。同样,量子力学方法——即密度泛函理论(DFT)——在1998年也获得了诺贝尔奖。经典分子动力学采用分子系统的简化表示,能快速模拟长时间的构象变化,但准确性较低。相比之下,量子模拟的相关方法,如密度泛函理论,提供了精确的计算,但对于大型生物分子来说计算成本过高而无法应用。


2024年11月6日,微软研究院的王童研究院及其团队历经四年研究在Nature上发表了文章Ab initio characterization of protein molecular dynamics with AI²BMD,开发的AI²BMD(基于AI的从头算生物分子动力学系统)实现了对各类蛋白质分子量子级精度的动力学模拟,比DFT方法模拟速度快多个数量级,并实现了对各类蛋白质性质更为准确的计算评估。


AI²BMD以超过10,000个原子的全原子分辨率高效模拟广泛的蛋白质,达到近似从头算(或第一性原理)精度。因此,它在生物分子模拟中实现了以前无法达到的权衡,比标准模拟技术——比经典模拟实现更高的精度,计算成本高于经典模拟,但比DFT能达到的速度快几个数量级。这一发展可能在生物分子建模中解锁新的能力,特别是对于需要高精度的过程,如蛋白质 - 药物相互作用。


图1. AI2BMD的整体流程。蛋白质通过碎片化过程被分成蛋白质单元。AI2BMD势能基于ViSNet设计,数据集在DFT水平生成。它计算整个蛋白质的能量和原子力。AI2BMD模拟系统基于这些组件构建,为模拟蛋白质的分子动力学提供了一种通用解决方案。它在能量和力的计算中实现了从头算精度。通过从动力学和热力学角度的全面分析,AI2BMD与湿实验室实验数据有很好的一致性,并检测到与分子力学不同的现象。


AI²BMD采用了一种新颖设计的通用蛋白质碎片化方法,将蛋白质分割成重叠单元,创建了一个包含2000万个不同构象的DFT精度的数据集——这是DFT水平上有史以来最大的数据集(在https://github.com/microsoft/AI2BMD免费获取)。基于我们之前设计的通用分子几何结构建模网络ViSNet(发表在Nature Communications https://www.nature.com/articles/s41467-023-43720-2,并作为基础模型加入Pytorch Geometry模型库:https://pytorch-geometric.readthedocs.io/en/latest/generated/torch_geometric.nn.models.ViSNet.html),团队使用机器学习训练了AI²BMD的势能函数。然后由高效的AI²BMD模拟系统进行模拟,在每一步中,基于ViSNet的AI²BMD势能以从头算精度计算蛋白质的能量和原子受力。通过从动力学和热力学的全面分析,AI²BMD与湿实验室数据(如蛋白质的折叠自由能)有更好的一致性,并且与经典分子动力学有不同的现象。

具体来说,AI²BMD在分子动力学模拟领域代表了以下几个方面的重大进步:


1.量子级计算精度:引入了一种通用的“机器学习力场”,这是一种原子和分子间相互作用的机器学习模型,用于全原子蛋白质动力学模拟,具有量子级的计算精度。

2. 解决泛化问题:它首次解决了机器学习力场在模拟蛋白质动力学中的泛化挑战,展示了对各种蛋白质进行稳健的从头算MD模拟。


3. 通用兼容性:AI²BMD将量子力学(QM)建模从小的局部区域扩展到整个蛋白质,而不需要对蛋白质有任何先验知识。这消除了蛋白质的QM和MM计算之间的潜在不兼容性,并将QM区域计算加速了几个数量级,使全原子蛋白质的近从头算计算成为现实。因此,AI2BMD为众多下游应用铺平了道路,并为表征复杂生物分子动力学提供了新的视角。


4. 速度优势:AI²BMD比DFT和其他量子力学方法快几个数量级。它支持对超过10,000个原子的蛋白质进行从头算计算,使其成为多学科领域中最快的AI驱动的MD模拟程序之一。


5. 多样构象空间探索:对于AI²BMD和MM模拟的蛋白质折叠和解折叠,AI²BMD探索了更多MM无法检测到的可能构象空间。因此,AI²BMD为研究药物 - 靶标结合过程、酶催化、变构调节、内在无序蛋白质等中的柔性蛋白质运动提供了更多机会,更好地与湿实验室实验保持一致,并为生物机制检测和药物发现提供更全面的解释和指导。


6. 实验一致性:AI²BMD优于QM/MM混合方法,并在不同的生物应用场景中与湿实验室实验表现出高度一致性,包括J耦合、焓、热容、折叠自由能、熔点和pKa计算。


在生物分子模拟中实现从头算精度具有挑战性,但对于理解生物系统的奥秘以及设计新的生物材料和药物具有巨大潜力。这一突破证明了人工智能促进科学发展的愿景——这一举措旨在引导人工智能的能力彻底改变科学探究。所提出的框架旨在解决机器学习力场应用中在准确性、稳健性和泛化性方面的局限性。AI²BMD通过考虑蛋白质的基本结构(即氨基酸链),在模拟各种蛋白质系统时提供了通用性、适应性和多功能性。这种方法增强了能量和力的计算以及动力学和热力学性质的估计。


AI²BMD的一个关键应用是其在药物发现中进行高精度虚拟筛选的能力。在2023年首届全球人工智能药物开发竞赛中,AI²BMD取得了突破,对于结合SARS-CoV-2主蛋白酶的药物小分子预测,其准确性超过了所有其他一千余名参赛者,获得了第一名,展示了其加速现实世界药物发现努力的巨大潜力。AI²BMD可以帮助推进科学问题的解决方案,并在药物发现、蛋白质设计和酶工程中实现新的生物医学研究。


原文链接:
https://www.nature.com/articles/s41586-024-08127-z

BioART战略合作伙伴

(*排名不分先后)


BioART友情合作伙伴
(*排名不分先后)

转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。





BioArt

Med

Plants

人才招聘

会议资讯



近期直播推荐