专栏名称: 智药邦
人工智能在药物研发领域的进展、探索与实践。
目录
相关文章推荐
小众软件  ·  半夜调API是大冤种?哦是 ... ·  12 小时前  
APPSO  ·  DeepSeek ... ·  22 小时前  
小众软件  ·  男人的乐趣,就是叛逆啊 ·  昨天  
APPSO  ·  阿里深夜发布重磅开源!暴击 Sora ... ·  2 天前  
小众软件  ·  微软开始测试免费的 Office 365 三件套 ·  2 天前  
51好读  ›  专栏  ›  智药邦

浙大/华为团队|3DSMILES-GPT:基于词元化语言模型的3D分子生成

智药邦  · 公众号  ·  · 2025-01-13 08:00

正文

分子生成是药物先导物发现和优化领域的一项重要创新技术,但当前这类方法在生成分子的有效性、结构合理性和合成可行性等多属性优化方面存在挑战,精度和效率往往难以两全。

2024年12月4日,浙江大学药学院康玉副教授、侯廷军教授和谢昌谕教授以及华为刘力维研究员团队在分子生成领域取得突破,成功研发了一种 全新的基于纯语言模型的分子生成框架:3DSMILES-GPT 。这一框架通过将分子的二维和三维结构视为语言表达,在语言模型的帮助下,实现了药物分子的高效生成。

相关成果以 “3DSMILES-GPT: 3D Molecular Pocket-based Generation with Token-only Large Language Model为题发表在Chemical Science上,并入选为2024 Chemical Science HOT Article Collection。

3DSMILES-GPT方法通过在大型药物样分子数据集上预训练模型,使其能够在保证结构合理性的前提下,快速生成具有良好成药性的分子。模型以Transformer解码器为骨架,通过将生成二维和三维结构的任务构建为自然语言生成的问题,将原子2D结构和3D坐标编码为字符,从而有效捕获分子的2D和3D信息。模型首先在PubChem数据集上进行预训练,然后在特定蛋白质-配体数据集上进行微调。此外,为了更好地提取蛋白质口袋信息,3DSMILES-GPT引入了一个可拆卸蛋白质编码器。

图1. 3DSMILES-GPT模型架构
实验结果显示, 相较于现有方法,3DSMILES-GPT在包括生物活性、类药性和可合成性在内的10项基准指标中的8项上表现出色。
这一研究为分子生成方法开发提供了新的视角,为实现创新药物的快速、合理设计提供了技术支持,期待这项技术能在未来的药物设计中展现出更大的应用价值。
参考资料:
https://doi.org/10.1039/D4SC06864E

--------- End ---------

感兴趣的读者,可以添加小邦微信加入 读者实名讨论微信群 。添加时请主动注明 姓名-企业-职位/岗位







请到「今天看啥」查看全文