小分子的化学合成,一直是科学研究中的一项挑战。近年来,深度学习模型在逆合成领域展现出了独特的优势,这些技术能够很好的解决化学家在逆合成设计中的遇到的一些问题。然而,
大多数
基于AI的逆合成模型都缺乏可解释性,无法阐明逆合成设计中的内在逻辑。
2025年1月18日,西北工业大学生命学院施建宇教授团队在《Nature Communications》上发表文章Single-step retrosynthesis prediction via multitask graph representation learning。
这项研究介绍了一种革命性的方法--Retro-MTGR,该方法能够深度挖掘逆合成反应中的化学逻辑,让药物合成的逆向推理变得更加智能和精准。
逆合成推理是从目标药物的分子结构出发,逆向推理出合成该药物的化学反应物。与传统的正向合成不同,逆合成推理让科学家们能够更高效地设计药物合成路线,极大地提高药物研发的效率。
Retro-MTGR:AI如何精准预测药物合成路径
施建宇教授团队提出的Retro-MTGR框架(如图1所示),是基于先进的“多任务图表示学习”的AI模型。通过深入学习分子结构中的图信息,
Retro-MTGR框架能够同时完成多个任务,具体包括两个主要任务和一个辅助任务
:
通过完成这三个任务,Retro-MTGR不仅帮助科学家们更好地理解化学反应机制,还能精准预测药物合成路径,为药物研发提供强大支持。
研究亮点:从键能到分子电性,AI揭示药物合成的深层规律
这项研究的最大亮点之一,在于通过学习分子化学键的结构,键能等属性,揭示了哪些化学键可能成为反应中心,哪些则可能只是普通的化学键(图2)。具体来说:
-
高键能(>=360 kJ/mol)的化学键,如双键和三键,通常是普通键;
-
低键能的单键(如C-N、C-O等)可能是反应中心,也可能是普通键,这取决于周围分子的结构;
-
反应中心的原子通常具有相反的电性,而普通键的原子则具有相似的电性。
不仅如此,Retro-MTGR还通过联合嵌入空间分析了合成子和离去基的电性分布,揭示了反应过程中的关键规律(如图3所示),这包括:反应中的两个合成子总是具有相反的电性并且彼此相距甚远;属于同一个反应物的合成子和离去基通常具有相反的电性并且彼此靠近;反应中同时出现的两个离去基经常具有相反的电性并且彼此相距甚远。
为了验证这一创新框架的有效性,研究团队通过预测两种药物Sonidegib和Acotiamide的逆合成路线,并与实际合成路线进行了对比。
图4. 对于两种药物的预测逆合成路线和真实化学合成路线展示
结果表明
,Retro-MTGR推断出的合成路线与实际结果高度一致(如图4所示),这无疑证明了其在药物研发中的巨大潜力。
为了开发一个高度可解释的判别模型来揭示化学合成机制,
本文提出了一个Retro-MTGR框架。基于分子图,在Retro-MTGR中同时考虑了三个相关任务,其中两个主要的监督判别任务负责识别反应中心和识别LGs,而一个辅助的自监督任务负责生成更好的原子嵌入。
与16种最先进的方法进行比较的结果,证明了Retro-MTGR的优越性。此外,在RTU和RTK场景中,不同的训练测试策略和不同大小的数据集验证了它的稳健性