专栏名称: 生信宝典
生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程;高通量测序数据分析学习教程;生信软件安装教程。所有内容均为原创分享,致力于从基础学习到提高整个过程。
目录
相关文章推荐
生物学霸  ·  中标的奥秘 — 本子、底子、圈子 ·  2 天前  
生物学霸  ·  Cancer ... ·  5 天前  
生物探索  ·  Cell Metab | ... ·  6 天前  
51好读  ›  专栏  ›  生信宝典

Science|David Baker团队设计1500万种新型大环化合物,为人工智能药物研发开辟新天地

生信宝典  · 公众号  · 生物  · 2024-10-24 21:00

正文

独家整理,盗用必究

在药物研发领域,大环化合物因其独特的结构和性质一直备受关注。然而,如何系统性地设计和合成这类化合物一直是一个巨大的挑战。近日,华盛顿大学的研究团队在《Science》杂志上发表了一篇重磅论文,开发出一种全新的计算方法,可以快速设计和筛选出数以百万计的新型大环化合物。这一突破性成果为药物研发开辟了新的方向,有望加速新药的发现和开发过程。

研究背景

大环化合物是一类由4个或更少氨基酸组成的小型环状分子,在自然界中广泛存在,具有广泛的生物活性,如抗真菌、抗生素、抗癌等作用。然而,目前还没有系统性的方法来生成这类化合物。

传统的大环化合物开发主要局限于对天然产物的改造,或者通过组合化学方法合成有限的化合物库。这些方法受限于现有的化学反应类型,难以探索更广阔的化学空间。

创新方法

华盛顿大学的研究团队开发了一种新颖的计算方法,可以系统地设计由α、β、γ和其他17种氨基酸骨架化学组成的有序大环化合物。

该方法包括三个关键步骤:

  1. 使用基于AIMNet势能面的自适应网格搜索,为每个单体识别低能量构象。

  2. 计算这些单体构象以及由这些单体成对组合构建的二肽构象的刚体变换,并存储在哈希表中。

  3. 通过识别哈希表中刚体变换组合接近于零的配对项,快速系统地生成大环化合物。

这种基于变换的方法允许研究人员快速识别由不同单体组合构成的二、三或四残基大环化合物,计算时间远少于显式构建每种不同单体组合的骨架坐标并评估闭合所需的时间。

重点在于,这种方法不受原子数量、身份和连接性的限制,只考虑它们在空间中的相对方位来确定闭合。

惊人的结果

利用这种方法,研究团队探索了由130个单体(属于22个化学类型)构建的三残基和四残基大环化合物的巨大空间。

该研究生成的大环化合物的化学多样性远超以往探索的范围。

结果令人震惊:他们成功预测了1490万个闭合环,由42,000多种单体组合构成,包含9至32个成员的环。这些大环化合物属于3,494种三残基和38,544种四残基化学类型。

相比之下,剑桥结构数据库(CSD)中只有206种化合物属于23种化学类型,PubChem数据库中有13,932种化合物属于397种化学类型。这一结果大大扩展了我们对大环化合物化学空间的认知。

实验验证

为了验证这些计算预测的准确性,研究团队合成了18个预测采用单一低能态的大环化合物,并通过X射线衍射或核磁共振确定了它们的结构。结果显示,其中15个化合物的实际结构与设计模型非常接近。

X射线晶体结构和NMR结构与设计模型的对比。

这些实验合成的大环化合物展现了多样的结构特征:

  • 一些含有模仿β转角的片段,这在蛋白质-蛋白质界面中很常见。
  • 一些含有顺式酰胺键,形成类似VI型β转角的结构。
  • 一个化合物中两个苯丙氨酸侧链的间距和方向模仿了α螺旋中i和i+4位置侧链的排列。

这些结构特征使得这些大环化合物有潜力成为靶向识别这些结构元素的蛋白质的候选药物。

药物性质评估

研究团队还评估了这些新设计的大环化合物的药物性质。他们使用平行人工膜渗透性测定(PAMPA)方法测量了29个大环化合物的被动膜渗透性。

结果令人鼓舞:

  • 29个化合物中有16个的log(Papp)值大于-6。
  • 只有3个在受体孔中未被检测到。
  • 在相同条件下,小分子药物普萘洛尔的log(Papp)值为-5.36。

这表明大多数设计的大环化合物具有良好的膜渗透性,这对于口服药物来说是一个非常重要的特性。

此外,研究人员还测试了这些化合物在血清中的稳定性。结果显示,除了一个化合物外,其他所有化合物在重组血清中的半衰期都超过24小时,表明它们对蛋白酶具有良好的抗性。

靶向抑制剂设计

为了进一步展示这种方法的实用价值,研究团队尝试设计针对三个感兴趣的蛋白靶点的选择性抑制剂:

  1. 组蛋白去乙酰化酶6(HDAC6)
  2. SARS-CoV-2的主蛋白酶Mpro
  3. Bak和MCL1的相互作用

HDAC6抑制剂

研究团队设计并合成了11个针对HDAC6的大环化合物。其中10个显示出对HDAC6的IC50值在1.5 nM到70 nM之间,比每个设计中存在的最小烷基硫醇基团的抑制活性提高了10倍到400倍。

最具选择性的这些大环化合物属于三种不同的化学类型,对HDAC6的选择性比其他测试的HDAC高100倍到1000多倍。这种选择性与一些先进的HDAC6选择性抑制剂相当。

设计的HDAC6抑制剂的化学结构、设计模型和浓度依赖性抑制曲线。

Mpro抑制剂

对于SARS-CoV-2的主蛋白酶Mpro,研究团队最初设计的6个抑制剂中只有一个显示出中等的IC50值(约16 μM)。随后,他们构建并重新对接了这个中等抑制剂的同系物的聚焦虚拟库,保持骨架化学和预测结构不变,仅改变侧链。

从这个虚拟库中,他们选择并化学合成了27个同系物,其中17个对Mpro显示出IC50值在4 μM到0.88 μM之间。三个活性设计的线性类似物显示IC50值>200 μM,支持大环化的重要性。

针对Mpro的初始命中化合物和最有效设计的大环化合物的化学结构和设计模型。

Bak-MCL1相互作用抑制剂

研究团队利用生成的大量大环化合物集合作为虚拟库,筛选可能抑制Bak和MCL1相互作用的化合物。他们首先生成了一个包含约270万个化合物的虚拟库,从中合成了18个化合物进行测试。其中3个在Förster共振能量转移(FRET)测定中显示出接近或低于50 μM的抑制活性。

随后,他们生成并对接了一个更大的约2700万个大环化合物的虚拟库。从合成的30个化合物中,他们识别出12个活性设计,IC50值从数十微摩尔到数百纳摩尔不等,最有效的达到220 nM。

两个最有效的设计的MCL1:Bak PPI抑制剂的化学结构和设计模型。

重要意义

这项研究的重要性在于:

  1. 化学空间的巨大扩展: 该方法开辟了一个包含近1500万个新型大环化合物的庞大化学空间,远远超过了目前已知的化合物数量。这为药物发现提供了前所未有的可能性。

  2. 结构多样性: 生成的大环化合物展现了丰富的结构多样性,包括模仿蛋白质中常见结构元素(如β转角和α螺旋)的化合物。这种多样性有助于开发针对各种蛋白质靶点的药物。

  3. 良好的药物性质: 大多数设计的大环化合物显示出良好的膜渗透性和血清稳定性,这对于开发口服药物至关重要。

  4. 靶向抑制剂的成功设计: 研究团队成功设计出了针对HDAC6、SARS-CoV-2 Mpro和Bak-MCL1相互作用的有效抑制剂,证明了这种方法在实际药物开发中的应用潜力。

  5. 计算效率: 该方法大大提高了设计和筛选大环化合物的效率,有望加速药物发现和开发过程。

未来展望

这项研究为药物发现开辟了新的方向。未来,研究人员可以:

  1. 进一步扩大化学空间,纳入更多diverse的侧链或非经典骨架。

  2. 针对特定靶点设计定制的大环化合物库,提高药物筛选的效率。

  3. 结合其他计算方法(如分子动力学模拟)进一步优化设计的化合物。

  4. 探索这些大环化合物在其他生物学应用中的潜力,如生物传感器、材料科学等。

总的来说,这项研究为药物发现和化学生物学领域带来了革命性的突破。它不仅大大扩展了可能的化学空间,还提供了一种系统、高效的方法来探索这个空间。随着这种方法的进一步发展和应用,我们有理由期待在不久的将来看到更多创新药物的诞生。

Salveson P J, Moyer A P, Said M Y, et al. Expansive discovery of chemically diverse structured macrocyclic oligoamides[J]. Science, 2024, 384(6694): 420-428.


高颜值免费 SCI 在线绘图(点击图片直达)


最全植物基因组数据库IMP (点击图片直达)

往期精品(点击图片直达文字对应教程)

机器学习