酶作为生物催化剂,在温和的条件下能够加速生物化学反应速率,对众多领域具有重要应用价值。然而,如何按照需要设计能够催化复杂反应的酶,尤其是从头设计丝氨酸水解酶,一直是酶工程领域的重大挑战。
近年来,
人工智能(AI)
在蛋白质设计中的应用取得了显著进展,尤其是最新的深度学习技术
为从头设计复杂的功能性蛋白质提供了新的机会
。
今天,
Science
杂志再次发布 2024 年诺贝尔化学奖得主、生物化学家和计算生物学家、华盛顿大学教授
David Baker
的一项重磅成果。
研究团队通过一种
深度学习模型 PLACER 和一种生成式模型 RFdiffusion
,成功设计了一系列具有
高催化效率的丝氨酸水解酶。
这些设计不仅在活性位点的几何结构上具有创新性,而且在催化效率上也显著优于以往的计算设计酶。
论文链接:
www.science.org/doi/10.1126/science.adu2454
研究团队认为,这是一种
突破传统方法限制的从头设计酶的方
法
,这项研究不仅在酶设计领域取得了重大突破,而且为未来设计更多新型酶提供了新的思路和方法,将对生物催化、医药和工业应用产生深远影响。
此外,这项研究还
展示了 AI 蛋白质设计在解决复杂生物化学问题中的巨大潜力
,为未来的酶工程研究提供了重要的参考。
突破限制的蛋白质
AI 设计方法
丝氨酸水解酶是一类以丝氨酸为催化基团的酶,能够催化酯类化合物的水解反应,在工业、医药等领域有着广泛应用。然而,
从头设计丝氨酸水解酶,一直是酶工程领域的重大挑战
。
一方面
,丝氨酸水解酶的活性位点非常复杂,需要精确排列多个催化残基,包括丝氨酸、组氨酸和天冬氨酸/谷氨酸,形成特定的氢键网络,才能实现高效的催化反应。
另一方面
,活性位点的预组织对于酶的催化效率至关重要,但实现这种预组织非常困难,尤其是在多步反应机制中。当前的方法在评估设计预组织时存在准确性和计算成本的限制。
传统酶设计方法通常基于已有的蛋白质骨架,这限制了活性位点的精确实现,导致许多设计酶的活性较低。
而且目前评估设计预组织的方法在准确性或计算成本上存在局限。
为了解决这些问题,
David Baker 团队构建了一种用于生成蛋白质骨架的 RFdiffusion 工具
。RFdiffusion 是一种基于深度学习的蛋白质设计方法,具体来说,RFdiffusion 首先会从一个完全随机的噪声状态开始,然后逐渐减少噪声,同时引导生成过程朝着目标蛋白质结构的方向发展。
这个过程类似于在蛋白质结构空间中进行随机游走,但每次游走的方向都会受到目标结构的引导。通过这种方式,
RFdiffusion 能够生成具有所需活性位点的蛋白质骨架
,这些骨架能够支撑特定的化学反应。
论文的共同作者 Ivan Anishchenko 等人,则构建了
一种用于评估设计的蛋白质在反应过程中的活性位点预组织情况的 PLACER 网络
。
它能够根据蛋白质骨架的坐标、氨基酸残基的身份以及结合小分子的化学结构,生成结合位点的全原子坐标集合。这使得研究团队能够评估设计的蛋白质在反应过程中各个关键状态的活性位点预组织情况。
图|使⽤ PLACER ⽐较天然和设计的丝氨酸⽔解酶的预组织
PLACER 的核心思想是通过模拟蛋白质和小分子之间的相互作用,生成一个包含多种可能构象的集合
。
这些构象反映了蛋白质在反应过程中的动态变化,从而为评估设计的酶的催化效率提供了更全面的信息。
在生成过程中,PLACER 首先会对输入的蛋白质结构和小分子进行编码,然后通过解码器生成可能的结合构象
。通过这种方式,PLACER 能够预测蛋白质和小分子之间的相互作用,并生成一个包含多种可能构象的集合。这个集合可以用于评估蛋白质在反应过程中的稳定性和活性,从而帮助研究团队优化酶的设计。
通过结合 RFdiffusion 和 PLACER 网络,研究团队希望能够突破传统方法的限制,设计出具有高催化效率的丝氨酸水解酶。
从头设计一种功能性酶
研究团队首先利用 RFdiffusion 从几何描述的活性位点出发,生成能够支撑丝氨酸水解酶活性位点的蛋白质骨架
。通过采样催化基团在反应过渡态周围的排列,生成活性位点基序,并枚举每个催化残基的 α-螺旋和 β-折叠骨架构象。
然后,研究团队使用 LigandMPNN 和 Rosetta FastRelax 进行序列设计和骨架优化,最终通过 AlphaFold2 预测设计结构,并筛选出与设计模型匹配的结构进行实验表征。
为了评估设计的活性位点在反应过程中的预组织,研究团队又
借助 PLACER 网络,根据蛋白质骨架坐标、氨基酸残基身份和结合小分子的化学结构,生成结合位点的全原子坐标
。
通过对反应路径上的每个关键状态(包括底物结合、四面体中间体、酰基-酶中间体等)进行建模,研究团队能够评估设计酶在每个反应步骤中的活性位点预组织情况。
在初步设计中,研究团队构建了相对简单的活性位点,通过两轮设计,他们筛选出了一系列具有潜在催化活性的设计,并在大肠杆菌中表达和测试。
实验结果显示,从第二轮设计中筛选出的设计具有更高的 FP 探针标记率和酯酶活性,表明