将
ScienceAI
设为
星标
第一时间掌握
新鲜的 AI for Science 资讯
编辑 | 萝卜皮
蛋白质是生命的基础,具有多样的生物功能,如输送氧气、传递化学信号和防御病原体。
其分子表面的特异性决定了其功能,这一特性被用于药物开发,通过设计分子与特定蛋白质结合来改变其结合方式,甚至开发「分子胶」来治疗疾病。
奥地利科学院(ÖAW)的 Michael Bronstein、瑞士洛桑联邦理工学(EPFL)的 Bruno Correia 等,率先使用了一种名为「MaSIF(molecular surface interaction fingerprinting)」的几何深度学习架构,用于设计具有所需分子表面特性的新蛋白质。
在最新的论文中,该团队将 MaSIF 应用于结合药物分子的蛋白质,并展示了如何用它设计「定制化」的蛋白质。
该研究以「
Targeting protein–ligand neosurfaces with a generalizable deep learning tool
」为题,于 2025 年 1 月 15 日发布在《
Nature
》。
大多数基于深度学习的蛋白质设计流程主要以天然氨基酸库为条件,因此缺乏对小分子相互作用设计的泛化能力。
这一差距主要是由于基于蛋白质数据库(PDB)的训练集中缺乏蛋白质-配体结构数据,尤其是三元复合物,而此类结构在 PDB 中非常罕见。
几何深度学习方法以分子表面的物理和化学特征为原则,可以克服这些限制,并为蛋白质和小分子复合物提供联合表征。
由此产生的新表面能够捕获可推广的分子特征,从而可以针对这些混合界面,设计蛋白质结合剂。
图示:捕获 Neosurface 属性来识别界面位置和结合伴侣。(来源:论文)
研究人员提出了一种基于几何深度学习的框架,称为 MaSIF,用于研究蛋白质表面特征和设计新的 PPI。
在几何深度学习框架 MaSIF 中,研究人员之前开发了两个应用程序:
(1) MaSIF-site,用于准确预测蛋白质表面中与另一种蛋白质形成界面的可能性较高的区域;
(2) MaSIF-search,用于根据互补表面斑块快速查找和对接蛋白质伴侣。
在 MaSIF 搜索中,先提取表面斑块描述符(指纹,fingerprints),以便具有互补几何和化学性质的斑块具有相似的指纹,而非相互作用的斑块具有较低的指纹相似度。
图示:使用 MaSIF-neosurf 设计配体诱导的蛋白质相互作用。(来源:论文)
表面指纹能够利用它们之间的欧几里德距离以无需对齐的方式实现初始超快速搜索。指纹距离低于阈值的斑块随后在三维空间中进一步对齐,并使用界面后对齐 (IPA) 分数进行评分,以优化选择。
「机器学习方法面临的一个关键挑战是它们的泛化能力,或者说该方法对从未见过的数据的处理效果如何。」Bronstein 解释道,「我们的研究结果令人惊讶且令人满意,即经过蛋白质间自然相互作用训练的神经网络可以很好地推广到从未见过的蛋白质-配体新表面。看来,我们的方法提取的分子表面几何描述符是蛋白质相互作用的一种『通用语言』。」