专栏名称: iNature
专注前沿科学动态,传递科普信息。
目录
相关文章推荐
羊城晚报  ·  演员李明德,被刑拘! ·  19 小时前  
羊城晚报  ·  演员李明德,被刑拘! ·  19 小时前  
BB姬  ·  《哪吒2》预测票房超160亿 ... ·  昨天  
BB姬  ·  《哪吒2》预测票房超160亿 ... ·  昨天  
陕西交通广播  ·  “谢广坤”,突传消息! ·  昨天  
陕西交通广播  ·  “谢广坤”,突传消息! ·  昨天  
51好读  ›  专栏  ›  iNature

AIphaFold3杀疯了!短期连发6篇Nature!!专家团队手把手教授!

iNature  · 公众号  ·  · 2024-07-16 09:00

正文


2024 年 5 月 8 日,谷歌 DeepMind 与 Isomorphic Labs 联合在《自然》期刊上发布蛋白质领域最新人工智能模型 AlphaFold 3!这一模型能够准确预测蛋白质、DNA、RNA 以及配体等生命分子的结构及其相互作用方式。这是继 AlphaFold 2 之后的又一重大突破

在预测类药物相互作用方面,AlphaFold 3 实现了前所未有的准确度,包括蛋白质与配体的结合以及抗体与其靶蛋白的结合。在 PoseBusters 的基准测试中, AlphaFold 3 的准确率比现有最佳传统方法高出 50%,而且无需任何结构信息输入,成为首个超越传统物理预测工具的人工智能系统。 这种预测抗体与蛋白质结合的能力,对于理解人类免疫反应的各个方面以及新抗体的设计至关重要。

深度学习在蛋白质设计领域的前沿研究主要集中在蛋白质结构预测、蛋白质序列设计、蛋白质-蛋白质相互作用预测、蛋白质功能注释和蛋白质优化与筛选等方面。这些研究方向为开发新的功能性蛋白质和药物靶点提供了新思路,并在生物医学、药物研发和生物材料等领深度学习在蛋白质设计领域的应用被认为是当前的前沿研究方向之一,深度学习在蛋白质设计领域的不断发展为新药研发、生物制药、生命科学研究等领域带来了许多创新和机会

2024年最值得期待的三大技术

一、深度学习蛋白质设计

二、CADD计算机辅助药物设计

三、AIDD人工智能药物发现设计


echnology



深度学习在蛋白质设计领域的 前沿研究 主要集中在蛋白质结构预测、蛋白质序列设计、蛋白质-蛋白质相互作用预测、蛋白质功能注释和蛋白质优化与筛选等方面。这些研究方向为开发新的功能性蛋白质和药物靶点提供了新思路,并在生物医学、药物研发和生物材料等领深度学习在蛋白质设计领域的应用被认为是当前的前沿研究方向之一,蛋白质结构预测与设计领域的未来将充满创新和跨学科的发展,为解决生物医学、生物工程和生物能源等方面的重大问题提供更多可能性。

蛋白质折叠和结构预测
:深度学习模型可以预测蛋白质的三维结构,这对理解蛋白质的功能和开展蛋白质设计至关重要。通过深度神经网络模型和注意力机制的应用,可以更准确地预测蛋白质的折叠和结构。
蛋白质序列设计
:深度学习可以用于预测蛋白质序列的功能和稳定性。通过神经网络模型和自然语言处理技术的结合,可以设计出具有特定功能和稳定性的蛋白质序列,例如酶活性、药物靶点等。
蛋白质-蛋白质相互作用预测
:深度学习模型可以预测蛋白质和蛋白质之间的相互作用,从而帮助设计新的蛋白质复合物和抗体。
蛋白质功能注释和预测
:深度学习可以进行蛋白质功能注释和预测,识别蛋白质的功能域、结构域和功能位点等。这有助于预测蛋白质的功能和相应的生物学作用。
蛋白质优化和筛选
:深度学习可以用于优化和筛选设计出的蛋白质。通过神经网络和生成对抗网络的应用,可以提高蛋白质的稳定性、可溶性和活性,以满足特定的设计要求。
蛋白质-蛋白质相互作用预测
:深度学习可用于预测蛋白质与蛋白质之间的相互作用,从而实现蛋白质和配体的高效率设计和筛选等。

近年来发过哪些顶刊以及方向:

Nature communications| 使用基于结构的残基偏好进行蛋白质设计

Nature biotechnology| 用于功能性蛋白质设计的机器学习

Scientific reports| Deep-WET:一种基于深度学习的方法,使用具有加权特征的词嵌入技术预测 DNA 结合蛋白

Cell Systems| 深度学习为蛋白设计开启了新时代

Nat. Comput. Sci| 基于深度学习的无rotamer蛋白质设计

Comput Struct Biotech| 深度学习用于蛋白质设计:从结构到序列与功能

本课程围绕蛋白设计基础与前沿工作展开讲述,从蛋白结构的预测与优化到蛋白的从头设计进行深度教学,本课程主要面向有编程基础的学员,对基础知识进行详细讲解,并且会结合前沿文献讲解相关技术的应用。帮助学员们, 通过本次培训学员将了解蛋白质设计的底层逻辑与基本规则,并掌握蛋白质设计中的常见蛋白质设计算法的实际操作,具备基本的蛋白质设计算法开发的基础能力及前沿视野。





















01

深度学习蛋白质设计课表

第一天: 深度学习蛋白质设计的相关概念及基础

1. 基础概念

a. 什么是深度学习

b. 什么是蛋白质设计 c. python 简介

d. inux VS code 简介

2. 如何描述一个蛋白质的状态

a. 量子力学: 含时薛定谔方程

b. 量子化学: 定态薛定谔方程

c. 全原子分子动力学模拟:朗之万方程

d. 粗粒化模拟: 广义朗之万方程 e. 马尔科夫态模型: 主方程

3. 常用的分析 / 可视化蛋白质及相关分子的方法

a. 获得并观察一条蛋白序列的 MSA

b. pymol chimeraX 可视化蛋白质分子体系

c. 小分子结构的生成与优化: rdkit GAMESS

d. 分子动力学模拟轨迹可视化: VMD

e. 通用序列 / 结构分析软件包: biopython

f. 生物大分子编辑平台: Discovery Studio

g. 位点冲突分析: Frustratomete

h. 简易生物分子空腔与通道分析: CAIN

4. 深度学习蛋白质设计与传统蛋白质设计之间的差异

a. 深度学习的本质

b. 传统方法: 通过物理能量推测概率

c. 深度学习: 直接从数据中找到概率分布的规律

d. 深度学习与传统的物理方法还是存在紧密联系的

e. 深度学习蛋白质设计的强大之处

f. 功能蛋白设计的滑铁卢: 玻尔兹曼废墟

5. 结构模型 vs 语言模型

a. 结构模型: 基于图神经网络

b. 语言模型: 天涯若比

c. 结构模型的优势及劣势

d. 语言模型的优势及劣势

e. 走向融合


第二天: 蛋白质设计的先行者: 蛋白质结构预测

1. AlphaFold 之前人们如何做蛋白质结构预测

a. 基于物理能量函数: rosetta

b. 传统分子对接

c. 分子动力学模拟

d. 同源序列分析

2. AlphaFold 系列历史

a. AlphaFold 开创一个时代

b. AlphaFold 2 终结一个时代

c. AlphaFold 3 走向未来

3. AlphaFold 3 原理解析

a. 本质上不是从序列到结构, 而是从 MSA 到结构

b. 注意力机制

c. 扩散模型

d. AlphaFold 3 的成绩与不足

4. AlphaFold 实际操作与结果分析

a. AlphaFold 2 实操

b. AlphaFold 2 分析

c. AlphaFold 3 实操

d. AlphaFold 3 分析

e. 别忽视结构之外的信息

5. 其它深度学习蛋白质结构预测软件简介

a. trRosetta

b. OmegaFold

c. ESMFold

第三天 蛋白质设计基础: 从经典力 场到深度 学习

1. 如何计算蛋白质构象的能量?

a) 蛋白质可视化与编辑常用方法

i. pymol使用方法简介

ii. chimera使用方法简介

iii. pdb文件格式详解

iv. 使用python biopython、pymol等库编辑蛋白质结构

b) 分子力学、溶剂化能简介

i. 分子力学公式形式

ii. 溶剂化能的计算方法

iii. MM/PBSA方法计算结合自由能

2. 基于统计势函数的蛋白质设计方法——Rosetta

a) 统计势函数的一般定义

b) 蛋白质设计中的统计势函数

i. Rosetta统计势定义

ii. Rosetta能量函数常见项及物理意义

c) 基于Rosetta势函数的蛋白设计

i. 设计流程

ii. 实验结果

3. 蛋白-蛋白对接的强大——无先验知识的蛋白质药物设计流程

a) 蛋白-蛋白对接简介

i. 蛋白-蛋白对接的定义

ii. RifGen对接方法介绍

b) 蛋白质药物设计

i. 设计流程

ii. 实验结果

4. 深度学习强势登场——蛋白质设计模型ProteinMPNN

a) MPNN 消息传递神经网络简介

b) ProteinMPNN模型简介

i. 模型结构介绍(输入、输出、参数……)

ii. 模型使用(主编程语言Python)

c) 基于ProteinMPNN的蛋白质设计

i. 设计流程

ii. 实验结果

5. 平分秋色还是天壤之别?两种蛋白设计方法的比较

a) 深度学习模型具有更高的序列恢复率

b) 深度学习模型可实现rosetta、alphafold不可完成的设计任务

c) 深度学习模型的短板



第四天: 深度学习蛋白质骨架设计

1. 为什么要走先设计骨架再设计序列的道路

2. 传统的蛋白质骨架设计

a. 简单粗暴的结构拼接

b. 理性地突变氨基酸以得到理想 的结构

c. RosettaRemodel 简介

3. 基于优化能量的蛋白质骨架设计模型: SCUBA

a. SCUBA 的基本原理其实很简单

b. 核心难点以及克服方法

c. SCUBA 实际操作

d. 不足之处

4. 基于扩散模型的蛋白质骨架设计模型

a. 改写时代的 RFdiffusion

b. 结合了 GAN SCUBA -D

c. 结合了 VQ PVQD

5. 实际的骨架从头设计流程:以结合蛋白从头设计为例

a. 功能口袋的选取

b. 带限制条件的骨架生成

c. 迭代优化

d. 特殊手段

第五天  基于Alphafold的下游应用

1. AF2多体蛋白结构预测的关键问题与解决途径

1.1 多序列比对中序列拼接配对问题

1.2 模板匹配问题

2. 利用AF2做蛋白和多肽柔性对接

2.1蛋白质表面几何物理化学互补问题

2.3 多肽柔性/构象处理

3. 利用AF2做蛋白结构和序列新设计

3.1 trrosetta幻想设计

3.2 AF2序列和结构幻想设计

4. 利用AF2做结构聚类发现新结构和功能

4.1 alphadatabase数据库结构简介与分析

4.2 foldseek结构比对工具介绍

4.3 新结构与新功能

5. 利用AF2做多构象预测和功能发现

5.1 MSA采样聚类分析及结构预测

5.2 不同MSA可以预测构象之间的转变和功能

6. 利用AF2的部分算法模块做模型质量评估和侧链构象等

6.1 三角机制提升蛋白质模型质量评估

6.2 局部三角机制和evoformer用于蛋白质侧链预测

第五天: 深度学习蛋白质序列设计

1. 传统的蛋白质序列设计

a. 基于力场

b. 基于同源序列

c. 走向数据驱动: ABACUS ABACUS 2

d. ABACUS 2 实际操作

2. 改变一个时代的杰作: ProteinMPNN

a. GNN 之前: 基于 CNN 的序列设计

b. ProteinMPNN 框架解析

c. ProteinMPNN 的广泛应

d. ProteinMPNN 实际操作

e. 潜在的问题

3. 其他的序列设计模型

a. ESM - IF 简介

b. ABACUS -R 简介

c. ABACUS -R 实际操作

4. 神奇的 CarbonDesign

a. AlphaFold 的启发

b. CarbonDesign 框架解析

c. CarbonDesign 成功的原因

d. 然而序列恢复率高并不等价于功能蛋白序 列设计成功率高

5. 基于结构的序列设计之梦魇: 本征无序区

a. 什么是本征无序区, 为什么会存在本征无序区

b. 本征无序区对蛋白质的功能是至关重要的

c. 本征无序区序列设计欠佳的核心原因

d. 当前的解决方案

第六天: 深度学习蛋白质设计前沿

1. 基于配体分子的功能蛋白设计

a. 骨架设计: RFdiffusionAllAtoms

b. 序列设计: LigandMPNN

2. 结构 - 序列协同设计

a. 为什么理论上协同设计要优于传统设计

b. 协同设计的难点

c. 当前协同设计所取得的进展

3. 动态蛋白质结构预测与设计

4. KAN 在深度学习蛋白质设计中的潜 在应用

a. 机器学习的可解释性

b. 物理信息机器学习

c. Kolmogorov - Arnold 表示定理

d. KAN vs MLP

e. KAN 潜在的优势

5. 如何避免玻尔兹曼废墟是核心问题

6. 展望未来

a. 基于化学反应机理的酶从头设计

b. 找到功能蛋白的蛋白质空间分布的 extropy






结构预测基础: 学生将学会通过生物信息学工具分析蛋白质序列,预测其二级结构和三维结构,并理解结构与功能之间的关联。

模型应用与评估: 学生将能够使用机器学习和深度学习模型进行蛋白质结构预测,同时学习如何评估模型的准确性和可靠性,选择正确的工具加以应用。

药物设计: 掌握与蛋白质结构预测相关的药物设计原理,学会设计靶向特定蛋白质的药物分子与多肽药物分子,理解蛋白类药靶相互作用的机制。

03

通过课程学习您将得到

基于深度学习的通用型蛋白设计模型 近几年来发展迅速,本课程围绕蛋白设计基础与前沿工作展开讲述,从蛋白结构的预测与优化到蛋白的从头设计进行深度教学,本课程从零基础开始讲解,对基础知识进行详细讲解,并且会结合前沿文献讲解相关技术的应用。帮助学员们, 通过本次培训学员将了解蛋白质设计的底层逻辑与基本规则,并掌握蛋白质设计中的常见蛋白质设计算法的实际操作,具备基本的蛋白质设计算法开发的基础能力及前沿视野。

















04

授课架构

1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿

2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握

3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答

05

课程解疑、学员评价以及资料

老师针对每一个学员的培训疑问都会耐心解答,每次培训将近2000余次解疑

将近300余页PPT还有相应代码,提供软件安装和指导,报名成功就发送预习视频进行预习



讲师介绍

主讲老师来自中国TOP高校,在国内顶尖教授组中从事人工智能蛋白质设计研究,目前的主要研究方向是酶与结合蛋白的设计和人工智能在进化尺度上的蛋白质设计。有着丰富的实战经验。已在Applied Physics Letters, eLife ,Nucleic Acids Research,ACS Omega,Journal of Molecular Biology等国际知名期刊上发表数篇工作



02

CADD计算机辅助药物设计

课程目标

Science Technology

CADD计算机辅助药物设计: 依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的相互作用,考察药物与靶点的结构互补、性质互补等,设计出合理的药物分子。它是设计和优化先导化合物的方法,特别是在食品、生物、化学、医药、植物、疾病方面应泛!靶点的发现与确证是现代新药研发的第一步,也是新药创制过程中的瓶颈之一。

计算机辅助药物设计(computer aided drug design)是以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的关系,设计和优化先导化合物的方法。计算机辅助药物设计实际上就是通过模拟和计算受体与配体的这种相互作用,进行先导化合物的优化与设计。计算机辅助药物设计大致包括活性位点分析法、数据库搜寻、全新药物设计

01

CADD计算机辅助药物设计课表

第一天 上午

背景与理论知识以及工具准备

1.PDB数据库的介绍和使用

1.1数据库简介

1.2靶点蛋白的结构查询与选取

1.3靶点蛋白的结构序列下载

1.4靶点蛋白的下载与预处理

1.5批量下载蛋白晶体结构

2.Pymol的介绍与使用

2.1软件基本操作及基本知识介绍

2.2蛋白质-配体相互作用图解

2.3蛋白-配体小分子表面图、静电势表示

2.4蛋白-配体结构叠加与比对

2.5绘制相互作用力

3.notepad的介绍和使用

3.1优势及主要功能介绍

3.2界面和基本操作介绍

3.3插件安装使用

下午

一般的蛋白

-配体分子对接讲解

1.对接的相关理论介绍

1.1分子对接的概念及基本原理

1.2分子对接的基本方法

1.3分子对接的常用软件

1.4分子对接的一般流程

2.常规的蛋白-配体对接

2.1收集受体与配体分子

2.2复合体预构象的处理

2.3准备受体、配体分子

2.4蛋白-配体对接

2.5对接结果的分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

第二天

虚拟筛选

1.小分子数据库的介绍与下载

2.相关程序的介绍

2.1 openbabel的介绍和使用

2.2 chemdraw的介绍与使用

3.虚拟筛选的前处理

4.虚拟筛选的流程及实战演示

案例:筛选新冠病毒主蛋白酶抑制剂

5.结果分析与作图

6.药物ADME预测

6.1ADME概念介绍

6.2预测相关网站及软件介绍

6.3预测结果的分析

第三天

拓展对接的使用方法

1.蛋白-蛋白对接

1.1蛋白-蛋白对接的应用场景

1.2相关程序的介绍

1.3目标蛋白的收集以及预处理

1.4使用算例进行运算

1.5关键残基的预设

1.6结果的获取与文件类型

1.7结果的分析

以目前火热的靶点

PD-1/PD-L1等为例。

2.涉及金属酶蛋白的对接

2.1金属酶蛋白-配体的背景介绍

2.2蛋白与配体分子的收集与预处理

2.3金属离子的处理

2.4金属辅酶蛋白-配体的对接

2.5结果分析

以人类法尼基转移酶及其抑制剂为例

3.蛋白-多糖分子对接

4.1蛋白-多糖相互作用

4.2对接处理的要点

4.3蛋白-多糖分子对接的流程

4.4蛋白-多糖分子对接

4.5相关结果分析

以α-糖苷转移酶和多糖分子对接为例

5.核酸-小分子对接

5.1核酸-小分子的应用现状

5.2相关的程序介绍

5.3核酸-小分子的结合种类

5.4核酸-小分子对接

5.5相关结果的分析

以人端粒

g -四链和配体分子对接为例。

操作流程介绍及实战演示

第四天

拓展对接的使用方法

1.柔性对接

1.1柔性对接的使用场景介绍

1.2柔性对接的优势

1.3蛋白-配体的柔性对接

重点:柔性残基的设置方法

1.4相关结果的分析

以周期蛋白依赖性激酶

2(CDK2)与配体1CK为例

2.共价对接

2.1两种共价对接方法的介绍

2.1.1柔性侧链法

2.1.2两点吸引子法

2.2蛋白和配体的收集以及预处理

2.3共价药物分子与靶蛋白的共价对接

2.4结果的对比

以目前火热的新冠共价药物为例。

3.蛋白-水合对接

3.1水合作用在蛋白-配体相互作用中的意义及方法介绍

3.2蛋白和配体的收集以及预处理

3.3对接相关参数的准备

重点:水分子的加入和处理

3.4蛋白-水分子-配体对接

3.5结果分析

以乙酰胆碱结合蛋白

(AChBP)与尼古丁复合物为例

第五天

分子动力学模拟(linux与gromacs使用安装)

1. linux系统的介绍和简单使用

1.1 linux常用命令行

1.2 linux上的常用程序安装

1.3体验:如何在linux上进行虚拟筛选

2.分子动力学的理论介绍

2.1分子动力学模拟的原理

2.2分子动力学模拟的方法及相关程序

2.3相关力场的介绍

3.gromacs使用及介绍

重点:主要命令及参数的介绍

4.origin介绍及使用

第六天

溶剂化分子动力学模拟的执行

1.一般的溶剂化蛋白的处理流程

2.蛋白晶体的准备

3.结构的能量最小化

4.对体系的预平衡

5.无限制的分子动力学模拟

6.分子动力学结果展示与解读

以水中的溶菌酶为例

第七天

蛋白-配体分子动力学模拟的执行

1.蛋白-配体在分子动力学模拟的处理流程

2.蛋白晶体的准备

3.蛋白-配体模拟初始构象的准备

4.配体分子力场拓扑文件的准备

4.1高斯的简要介绍

4.2 ambertool的简要介绍

4.3生成小分子的力场参数文件

5.对复合物体系温度和压力分别限制的预平衡

6.无限制的分子动力学模拟

7.分子动力学结果展示与解读

8.轨迹后处理及分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

02

课程目标

让学员熟练掌握: PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、分子动力学等技术

03

培训对象

目前计算机辅助药物设计受众人体众多,列如CADD、药物设计、药学、药物研发、药物筛选、新药研发、药物化学、生物制药、免疫、天然产物、兽药研发,生物信息、中药药理、中药化学、网络药理、结构药理、食品安全、食品风味、食药研发、食品研发、抗肿瘤药物、肿瘤免疫、酶工程、遗传、抗体药物、农业工程、化学、有机合成、有机化学、结构生物、合成生物等众多科研人员。


04

培训架构

1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿

2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握

3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答


05

授课资料

老师备课PPT将近1000余页,培训软件都会提供以及指导安装    目前为止已经举办30余期,参会学员达3000余人,学员评价一致非常满意,算是国内CADD计算机辅助药物设计最好的培训课程


计算机辅助药物设计主讲老师来自国内高校北京协和医院药物研究所,主要擅长药物虚拟筛选、计算机辅助药物设计、人工智能药物发现、分子对接、分子动力学等方面的研究,有十余年的研究经验,以第一作发表论文20余篇

讲师介绍

计算机辅助药物设计主讲老师来自国内高校北京协和医院药物研究所,老师主要擅长深度学习、机器学习、药物虚拟筛选、计算机辅助药物设计、人工智能药物发现、分子对接、分子动 力学等方面的研究,有十余年的研究经验。


SPORTS


03

AIDD人工智能药物发现与设计发现



课程目标

Science Technology

AIDD人工智能药物发现与设计: 是人工智能和机器学习技术使制药领域实现了现代化。目前机器学习和深度学习算法已被应用于多肽合成、虚拟筛选、毒性预测、药物监测和释放、药效团建模、定量构效关系、药物重定位、多药理和生理活性等药物发现过程。可以很好的将传统的面向化学的药物发现与人工智能药物设计相结合。此外,世界各地的系统生物学和化学科学家与计算科学家合作,开发现代ML算法和原理,大大的可以促进药物的发现和开发。

01

AIDD人工智能药物发现与设计 课表

第一天

1.AIDD概述及药物综合数据库介绍

2.人工智能辅助药物设计AIDD概述

3.安装环境

(1)anaconda

(2)vscode

(3)pycharm

(4)虚拟环境

4.第三方库基本使用方法

(1)numpy

(2)pandas

(3)matplotlib

(4)requests

5.多种药物综合数据库的获取方式

(1)KEGG(requests爬虫)

(2)Chebi(libChEBIpy)

(3)PubChem(pubchempy / requests)

(4)ChEMBL(chembl_webresource_client)

(5)BiGG(curl)

(6)PDB(pypdb)

第二天 ML-based AIDD

1.机器学习

(1)机器学习种类:

①监督学习

②无监督学习

③强化学习

(2)典型机器学习方法

①决策树

②支持向量机

③朴素贝叶斯

④神经网络

⑤卷积神经网络

(3)模型的评估与验证

(4)分类评估:准确率、精确率、召回率、F1分数、ROC曲线、AUC计算

(5)回归评估:平均绝对误差、均方差、R2分数、可释方差分数

(6)交叉验证

2.sklearn工具包基本使用

3.rdkit工具包的基本使用

4.化合物编码方式和化合物相似性理论知识

5.项目实战1:基于ADME和Ro5的分子筛选

6.项目实战2:基于化合物相似性的配体筛选

7.项目实战3:基于化合物相似性的分子聚类

8.项目实战4:   基于机器学习的生物活性预测

9.项目实战5:基于机器学习的分子毒性预测

第三天 GNN-based AIDD

1.图神经网络

(1)框架介绍: PyG,DGL,TorchDrug

(2)图神经网络消息传递机制

(3)图神经网络数据集设计

(4)图神经网络节点预测、图预测任务和边预测任务实战

2.论文精讲:DeepTox: Toxicity Prediction using Deep Learning

3.项目实战1:基于图神经网络的分子毒性预测

(1)SMILES分子数据集构建PyG图数据集

(2)基于GNN进行分子毒性预测

4.项目实战2:基于图神经网络的蛋白质-配体相互作用预测

(1)蛋白质分子图形化,构建PyG图数据集

(2)基于GIN进行网络搭建及相互作用预测

第四天 NLP-based AIDD

1.自然语言处理

(1)Encoder-Decoder模型

(2)循环神经网络 RNN

(3)Seq2seq

(4)Attention

(5)Transformer

2.项目实战1:基于自然语言的分子毒性预测

(1)SMILES分子数据集词向量表示方法

(2)基于NLP模型进行分子毒性预测

3.项目实战2:基于Transformer的有机化学反应产量预测 (Prediction of chemical reaction yields using deep learning)

4.论文精读及代码讲解:《Mapping the space of chemical reactions using attention-based neural networks》

第五天 分子生成与药物设计

1.分子生成模型

(1)循环神经网络RNN

(2)变分自动编码器VAE

(3)生成对抗网络GAN

(4)强化学习RL

2.项目实战1: 基于图数据的小分子化合物生成模型《A Graph to Graphs Framework for Retrosynthesis Prediction》

3.项目实战2: 基于NLP的抗体生成模型《Generative language modeling for antibody design》



02

课程目标

AIDD人工智能药物发现与设计课程 :让学员了解药物发现的前沿背景,学习人工智能领域的各类常见算法,熟悉工具包的安装与使用,掌握一定的算法编程能力,能够运用计算机方法研究药物相关问题。通过大量的案例讲解和实践操作,具备一定的AIDD模型构建和数据分析能力








请到「今天看啥」查看全文