专栏名称: 奇物论
科学,需要一点好奇心~
目录
相关文章推荐
爱可可-爱生活  ·  《爱可可微博热门分享(2.26)》 ... ·  2 天前  
政事堂2019  ·  特朗普,美国永远的250! ·  2 天前  
大白话时事  ·  【稿费】乌克兰同意卖身 ·  2 天前  
黄建同学  ·  //@udonwudong:还有各种语言的版 ... ·  2 天前  
51好读  ›  专栏  ›  奇物论

一手Science一手Nature,AI蛋白质设计领域又一重大突破!

奇物论  · 公众号  ·  · 2025-02-14 11:00

正文


图片

2024年12月5日,David Baker 教授团队在国际顶尖学术期刊 Science 上发表了题为:Target-conditioned diffusion generates potent TNFR superfamily antagonists and agonists 的研究论文。研究团队使用他们之前开发的RFdiffusion算法来设计肿瘤坏死因子受体(TNFR)的结合蛋白。研究团队在初始设计生成后使用部分扩散设计出具有低皮摩尔级亲和力的结合蛋白,同时还具有高特异性的优点。这些人工设计的蛋白质可以应用于生物学研究,并可能作为潜在的疾病治疗药物。

近日,来自美国华盛顿大学西雅图分校生物化学系的David Baker研究团队和丹麦技术大学生物技术与生物医学系的Timothy P. Jenkins研究团队合作在Nature杂志发表题为De novo designed proteins neutralize lethal snake venom toxins的研究论文, 该研究旨在利用深度学习方法从头设计蛋白质,以中和3FTx蛇毒毒素。
通过设计特定的蛋白质结构,可以实现预期的生物功能,如催化特定化学反应、识别和结合特定分子、调控生物信号传导等,为生物医学、药物研发、生物技术等领域提供重要工具和解决方案。

传统的蛋白质设计方法主要依赖于已知蛋白质结构的同源建模、理性设计等技术,这些方法在面对全新功能的蛋白质设计、复杂结构的改造以及大规模高通量设计时存在诸多局限,如设计空间有限、效率低下、成功率不高、难以预测和优化蛋白质的稳定性和功能等。

深度学习技术通过从大量数据中学习特征和模式,能够识别蛋白质序列与结构之间的复杂关系,从而在蛋白质设计中实现从序列到结构的高效预测和生成。 深度学习模型可以将蛋白质设计的多个环节,如序列设计、结构预测、优化等整合到一个端到端的流程中,简化操作步骤,提高设计效率和准确性。

Rosetta 是一款经典的蛋白质建模和分析软件,其基于物理能量函数和蒙特卡洛搜索算法,能够对蛋白质结构进行精确的预测和优化。 Rosetta提供了丰富的模块和工具,如RosettaScripts,为蛋白质设计提供了强大的基础支持。RFdiffusion是一种基于深度学习的蛋白质结构生成技术,它利用扩散模型和自回归生成模型,能够从头生成新颖的蛋白质结构,并且在特定骨架引导设计、活性位点嫁接、对称性设计等方面展现出独特的优势,为蛋白质设计开辟了新的思路和方法。

综上所述,本次培训会议是在深度学习驱动蛋白质设计这一新兴领域快速发展的背景下举办,旨在促进相关领域的科研人员、工程师及产业界人士对该领域的理解与技术掌握,推动深度学习技术在蛋白质设计领域以及计算机辅助药物设计、药物研发领域的创新应用与实际转化。本次培训会议的主办方为 北京软研国际信息技术研究院 ,承办方 互动派(北京)教育科技有限公司 ,会议会务合作单位为 北京中科四方生物科技有限公司 ,具体相关事宜通知如下:

★ 目录 ★

专题一

(线上直播)

深度学习驱动的蛋白质设计技术与实践

(详情内容点击上方名称查看)

2025年03月21日-03月23日

专题二

(精品录播)

计算机辅助药物设计-从蛋白质结构到药

物候选物的全方位实战

(详情内容点击上方名称查看)

专题三

(精品录播)

GROMACS分子动力学模拟、药物开发溶剂筛选技术与应用

(详情内容点击上方名称查看)

专题四

(精品录播)

AMBER分子动力学能量优化与分析、结合自由能计算技术与应用

(详情内容点击上方名称查看)

专题五

(精品录播)

高通量虚拟筛选技术及在中药/天然产物挖掘药效分子中的应用

(详情内容点击上方名称查看)


培训对象

本培训课程面向生物学、药学、基础医学、畜牧与动物医学、肿瘤学、生物医学工程等领域的研究人员、工程师、研究生和对超表面技术感兴趣的专业人士。



01

讲师介绍


由国家双一流、985高校特聘研究员、博士生导师讲授。 近五年发表SCI研究论文20余篇,获国际生物设计会议奖励(The International BioDesign Research Conference)。 主持基金委蛋白质设计相关项目和科技部重点研发计划课题多项。主要擅长分子设计、分子模拟方法研究。




02

课程大纲

目录及主要内容

Rosetta蛋白质设计: 基础概念

一、Rosetta基础元素和Rosetta力场优化

1、Pose/mover/scorefunction

2、单体结构的扰动和优化:Minimization和Relax

3、蛋白复合物结构的扰动和优化

二、蛋白质结构viewer和Linux入门命令

1、用户属组及权限 目录文件属性

2、LINUX基础命令 环境变量

3、shell常用命令练习 vim编辑器

Rosetta蛋白质设计: 应用案例

三、RosettaScripts应用

1、Residue Selector,Task Operation,Filter等组件

2、结构从头设计:Blueprint

3、序列设计和优化:FastDesign

RFdiffusion

创新结构生成技术

四、背景介绍

1、结构生成过程中的物理能量函数与约束

2、基于Deep learning的预测模型和生成模型

3、结构验证与性能评估

五、RFdiffusion基于指定骨架的蛋白质结构设计

核心知识点:利用用户提供的特定结构框架进行蛋白质结构设计

1、无约束单体设计(contigmap):全新骨架的蛋白质结构创新设计,通过RFdiffusion实现从头生成新颖、非同源蛋白质结构

2、特定骨架引导设计 (scaffoldguided):利用已有结构骨架指导蛋白质结构创新与改造

RFdiffusion

高级应用及领域热点

六、RFdiffusion含活性位点的蛋白质结构设计

核心知识点:使用RFdiffusion构建具有特定生物活性的蛋白质结构

1、Motifscaffold: inference.input_pdb &   contigmap.inpaint_seq:如何整合已知活性位点信息,嫁接到设计的新蛋白质结构上

实例分析:酶活位点嫁接,对称位点嫁接的设计策略与实施

七、蛋白质-蛋白质相互作用界面(PPI):Binder设计

核心知识点:利用RFdiffusion设计能有效介导蛋白间相互作用的Binder区域

1、ppi.hotspots:识别和利用PPI热点信息来定制Binder结构

2、设计实例:针对指定骨架和/或特定motif的Binder结构创建

八、RFdiffusion中的对称性设计

核心知识点:阐述如何在蛋白质结构设计中考虑并实现对称性特征

1、Inference.symmetry: 对称性建模与控制

2、potentials:优化对称单元间的能量分布与稳定性

九、多样性

核心知识点:探究RFdiffusion在处理结构多样性上的机制和优势

diffuser.partial_T:局部扩散与全局优化相结合,提高结构多样性和稳健性

RFdiffusion中的noise

ProteinMPNN

LigandMPNN 序列设计基础与高级应用

十、ProteinMPNN序列设计入门

核心知识点:介绍ProteinMPNN的核心架构与训练过程,掌握ProteinMPNN和LigandMPNN在不同场景下的蛋白质结构序列设计流程

应用案例:

1、Monomer单体序列设计:用ProteinMPNN针对单体蛋白质进行序列设计

2、Complex复合物zhong 指定链设计:利用ProteinMPNN在复合物环境下设计特定链的序列,涉及链间相互作用的考虑与优化

3、Models, Helper scripts, number of sequences:深入了解模型使用方法、辅助脚本的功能以及决定生成序列数量的因素

十一、指定设计位点与氨基酸偏好性设置

核心知识点:如何运用深度学习工具来精准控制特定氨基酸残基的位置与特性

应用案例:

1、Fix position与Redesign position:保留某些部位不变(Fix position)和重新设计其他部位(Redesign position)的具体操作

2、Bias AA与Omit AA:在设计过程中如何设置氨基酸偏好性,包括优先选择某些氨基酸(Bias AA)和排除特定氨基酸(Omit AA),以满足特定功能需求或生物物理化学特性

RFdiffusion与

ProteinMPNN 高级应用案例分析

十二、MPNN进阶应用

核心知识点:MPNN对称性处理与同聚多体设计、MPNN设计多样性与温度参数调控

应用案例:

1、MPNN处理对称性Symmetry:讲解MPNN如何识别和处理蛋白质的对称性特征,特别是对于Homooligomers(同聚多体)的设计

2、Tied position(绑定位置):探讨MPNN在处理需要保持多个位置协同变化以维持特定对称模式的情况下的具体方法

3、MPNN设计多样性:探究MPNN如何通过温度参数调整来促进设计序列的多样性,以及多样性对最终蛋白质功能和稳定性的影响

十三、Colabfold 结构预测与深度学习应用

1、MSA、pLDDT和pAE:介绍多序列比对(Multiple Sequence Alignment)、预测精度得分(predicted Local Distance Difference Test, pLDDT)和原子接触误差(predicted Atomic Error, pAE)在蛋白质结构预测中的重要作用

2、逆转网络与幻想蛋白设计

探讨如何通过深度学习技术逆向设计已知结构或创造新型蛋白质结构可能性

互动讨论

1、分享与解析近期领域内热点研究成果中RFdiffusion + ProteinMPNN的实际应用案例

2、讨论并解决实际操作中可能遇到的问题与挑战,进一步提升学员对深度学习在蛋白质结构设计领域中的理解和应用能力

☆ 部分案例图示:




03

报名须知


时间地点







请到「今天看啥」查看全文