近期,《
Nature
》刊登了一篇题为《
Targeting protein-ligand neosurfaces with a generalizable deep learning tool
》的重磅文章,展示了一种全新的深度学习工具
MaSIF-neosurf
,为蛋白-配体相互作用表面的设计开辟了新领域。这项研究通过结合几何分析和深度学习,首次实现了对蛋白-配体复合物中“新表面”(
neosurfaces
)的通用化设计。
以下是对这篇重要文献的详细解析:
研究背景
蛋白-蛋白相互作用(PPIs)驱动了生物系统中的大部分分子过程,而小分子配体的结合能够显著调控这些相互作用,从而影响疾病和生物功能。然而,传统的蛋白设计工具在处理蛋白-配体复合物时面临诸多挑战,例如:
-
复杂性:
配体结合可能诱导蛋白表面的显著变化,难以预测。
-
缺乏数据:
针对配体诱导相互作用的结构数据较少,限制了深度学习工具的训练。
-
有限的通用性:
现有工具多针对特定蛋白或配体,难以扩展到更广泛的体系。
为解决这些问题,MaSIF-neosurf 提出了一种基于蛋白表面特性的深度学习策略,通过捕捉蛋白-配体复合物的新表面特性,设计与其结合的蛋白。
Fig. 1 | Neosurface properties are captured to identify interface sites and binding partners.
研究亮点
1. MaSIF-neosurf 的核心理念
MaSIF-neosurf 是一种基于几何深度学习的工具,利用蛋白和配体的表面特性,设计出与其高度匹配的结合蛋白。其创新之处包括:
-
表面特性学习:
提取分子表面的几何特性(形状指数、曲率)和化学特性(静电、疏水性、氢键供受体);
-
通用性:
通过深度学习模型实现对蛋白-配体界面的广泛适应性;
-
高效性:
显著缩短设计时间,同时提高了成功率。
2. 针对三大复合物的设计与验证
研究团队选择了三种典型的蛋白-配体复合物进行验证:
-
Bcl2-venetoclax
(临床抗癌药物复合物)
。
-
DB3-progesterone
(激素结合相关抗体)。
-
PDF1-actinonin
(抗生素结合蛋白)。
通过深度学习设计的结合蛋白展现了高度特异性和结合亲和力(达到纳摩尔级别),并通过多种实验手段(如晶体学、突变验证)确认了其设计的准确性。
Fig. 2 | Design of ligand-induced protein interactions with MaSIF-neosurf.
方法与技术实现
1. 表面特性计算
MaSIF-neosurf 对蛋白-配体复合物的表面进行以下特性提取:
-
几何特性:
包括形状指数和曲率;
-
化学特性:
包括静电势分布、氢键供受体位置及疏水性。
这些特性通过深度学习模型被转化为“表面指纹”,用于识别与目标表面互补的结合位点。
2. 种子搜索与优化
-
在数据库中搜索与目标表面特性高度匹配的结构片段(种子)。
-
使用
Rosetta
工具优化种子片段的结合能和结构稳定性。
-
3. 实验验证
研究通过酵母展示技术、晶体学和冷冻电镜验证了设计蛋白的结合模式和特异性。
Fig. 3 | De novo design and screening of small-molecule-dependent binders.
结果与发现
-
设计性能优异:
MaSIF-neosurf 在70%以上的测试中成功识别并设计出与目标配体结合的蛋白,而传统方法的成功率远低于此。
-
结合亲和力显著提高:
通过突变优化,设计的结合蛋白亲和力达到纳摩尔级别。
-
广泛适用性:
工具展示了从蛋白到配体的强大泛化能力。
Fig. 4 | Binding mode, affinity and structure determination of the designed binders.
研究意义与展望