专栏名称: 智药邦
人工智能在药物研发领域的进展、探索与实践。
目录
相关文章推荐
开发者全社区  ·  DB总的瓜 ·  10 小时前  
新闻大连  ·  官宣闭店后,麦凯乐西安路店何去何从? ·  2 天前  
51好读  ›  专栏  ›  智药邦

NVIDIA发布GenMol:AI药物发现新工具

智药邦  · 公众号  ·  · 2025-02-06 08:00

正文


在当今药物研发领域,发现具有特定化学性质的新分子是一个极其复杂且耗时的过程。然而,传统的分子生成模型通常只能针对特定任务进行优化,难以满足多样化的药物发现需求。今天,我们带来了一项最新的研究成果—— GenMol ,一个基于离散扩散模型的通用分子生成框架,为药物发现带来了革命性的变革。

一、背景:药物发现的挑战

药物研发流程包括多个关键阶段:

  1. 片段约束分子生成: 在保留已知活性片段的基础上设计新分子。
  2. 命中生成: 筛选出具有目标活性的候选分子。
  3. 先导优化: 对候选分子进行优化以提高药物特性。

现有分子生成模型的局限性:

  • 任务专一: 大多数模型只能处理单一或少数任务。
  • 适应性差: 不同任务需要高昂的再训练成本。
  • 效率低下: 传统序列化解码方式难以满足大规模生成需求。

二、GenMol 的核心创新

1. SAFE 表示法:为分子生成提供新视角

  • 片段化分子表示: GenMol 使用 SAFE(Sequential Attachment-based Fragment Embedding)表示法,将分子分解为多个片段。
  • 无序排列: 片段的顺序不影响分子的整体结构,简化了复杂分子的生成任务。
  • 应用场景: 骨架装饰、连接子设计、超结构生成等任务均可高效处理。

2. 掩码离散扩散模型:并行解码提升效率

  • 离散扩散原理
    (1)模型通过逐步掩码和反掩码(masked-unmasking)恢复分子结构。
    (2)基于 BERT 架构的双向注意力机制,支持并行解码。
  • 优势
    (1)解码效率显著提升,且生成质量不受影响。
    (2)支持对分子序列的多点预测。

3. 片段重掩码策略:优化化学空间探索

  • 核心思想:随机选择分子中的片段进行掩码,生成新的片段替换。
  • 工作机制
    (1)初始化分子片段。
    (2)迭代优化替换,生成更优分子。
  • 创新点
    (1)以片段为单位的优化更符合化学直觉。
    (2)高效探索化学空间,发现更优的分子解。

三、GenMol 的广泛应用

1. 去新生成

  • 目标:从零生成具有药物特性的分子。
  • 实验结果
    (1)GenMol 的分子生成有效性(Validity)达到 100%,显著优于传统模型。
    (2)可通过调整参数,在质量和多样性之间实现动态平衡。

2. 片段约束生成

  • 任务类型
    (1)连接子设计: 连接两个分子片段。
    (2)骨架装饰: 在分子骨架上添加新片段。
    (3)超结构生成: 在子结构约束下生成完整分子。
  • 实验结果: 在多个片段约束任务中,GenMol 的分子质量和多样性均超过现有模型。

3. 目标导向的命中生成

  • 目标: 生成满足特定化学性质的候选分子。
  • 实验结果: 在 23 个任务中,GenMol 在 18 个任务中表现最佳,验证了其强大的化学空间探索能力。







请到「今天看啥」查看全文