专栏名称: CBG资讯
化学及生物相关领域科研知识和经验的传递和共享,旨在创建属于科研人的学术交流平台,主要包括课题组人物专访、顶刊文献解读、科研资讯等内容。
目录
相关文章推荐
收获  ·  《收获》专稿 | ... ·  3 天前  
中科院物理所  ·  非常规超导转变温度的可能上限 | 进展 ·  3 天前  
做書  ·  救命!我的翻译是一位设计师 ·  4 天前  
51好读  ›  专栏  ›  CBG资讯

突破性进展!Nature爆发!2023年最年轻中国学者连发Nature!

CBG资讯  · 公众号  ·  · 2023-09-06 10:28

正文

多位科学家曾因 CRISPR 基因编辑技术斩获诺贝尔奖, 这项技术也被《麻省理工学院技术评论》杂志评选为2023年十大突破性技术之一。 现如今生命科学领域最火的技术之一便是基因编辑,2012年CRISPR-Cas9的工作原理被解析,稍后在2013年,华裔科学家张锋首次将CRISPR-Cas9基因编辑技术应用于哺乳动物细胞,正式开启了基因编辑的应用之路,《Science》2017 年度突破、《Nature》2017 年度人物均授予了 CRISPR 相关技术的突破,2020年CRISPR技术获得诺贝奖,短短不到十年时间CRISPR技术荣获最高学术荣誉,足以看出该技术的应用潜力,基因编辑技术广泛应用于人、大鼠、小鼠、斑马鱼、果蝇、猪、水稻、小麦和拟南芥等动植物(细胞)以及细菌等微生物的基因组靶向改造,并已在功能基因组研究、疾病防治、动植物育种、动物疾病模型开发、基因治疗等领域展现出巨大的应用前景。成为当下科研工作者的新宠儿。

由于该项研究资料和学习平台较少,信息技术不公开,培训学习迫在眉睫,特此诚挚邀请您参加 “CRISPR-Cas9基因编辑技术专题 +机器学习微生物组学 +机器学习转录组学与表观组学 +深度学习基因组学 +蛋白质晶体结构解析 +机器学习代谢组学+CADD计算机辅助药物设计+AIDD人工智能药物发现与设计” 专题线上培训课,参会学员已达3000余名!学懂学会学透彻学以致用,做出有价值的科学研究, 能够快速运用到自己的科研项目和课题上,助力学员发表Nature、Science、Cell等正刊及子刊!(新技术加持下,用更少的经费,发更高质量的文章)

专题一、CRISPR-Cas9基因编辑


第一天

一. 基因编辑工具介绍

1. 基因编辑和转基因是一样的吗?

2. 生活中的基因编辑与转基因产品

3. 基因编辑工具先驱-ZFNs和TALENs

4. 没落的ZFNs和TALENs

5. TALENs,旧工具新用,细胞器编辑利器!

6. 强势崛起的CRISPR系统

7. CRISPR系统家族介绍

8. CRISPR-Cas9的工作原理

9. CRISPR-Cas12的工作原理

10. CRISPR系统的致命缺点

11. 如何选择合适的CRISPR系统?

第二至三天

二. CRISPR系统可以做什么?

1. 基因敲除/基因敲入

i. 基因修复途径介绍(NHEJ和HDR)

ii. Knock-in和Knock-out的简介

iii. Knock-in策略简介(HDR/Retron/双pegRNA策略/GRAND/TJ-PE)

2. 多敲系统简介

3. CRISPRa/CRISPRi(基因激活与基因抑制)

i. dCas9-PVPR系统介绍

ii. dCas9-VP64/GI/SAM基因激活系统介绍

iii. 基因编辑招募系统介绍(Suntag/Moontag)

4. CRISPR系统的‘另类’应用(循环打靶)

5. CBE系统的原理及其应用

i. CBE系统进化过程总结(CBEmax/每代优化的元件及策略汇总)

ii. 基因组CBE编辑(植物育种/基因功能研究/临床治疗)

iii. 细胞器CBE编辑工具介绍(Ddda脱氨酶/MutH切口酶)

iv. CBE系统的脱靶效应

6. ABE系统的原理及其应用

i. PACE和PANCE人工定向蛋白进化系统介绍及其他常规的蛋白进化技术

ii. ABE系统的进化过程总结(ABEmax/ABE8e每代优化的元件及策略汇总)

iii. ABE系统的‘另类’应用(基因失活/跳剪/介导C编辑)

iv. 双碱基编辑系统(SWISS/STEME/A&C-BEmax/SPACE/ACBE)

7. PE系统的原理及其应用

i. PE介导精准编辑

ii. 编辑效率的影响因素(骨架二级结构/PBS长度/RTT模板)

iii. 双pegRNA的原理及其应用(基因组大片段插入)

iv. 基因组大片段删除

v. 用于AAV递送的PE系统

8. gGBE的原理及其应用

i. 糖基化酶介绍(为什么可以介导碱基编辑?)

ii. gGBE的开发与应用

iii. gGBE的后续发展预测

9. CRISPR-Case12的病毒检测应用

i. 原理介绍

ii. 应用案例介绍

第四天

三. CRISPR载体构建(实操)

1. 敲除/碱基编辑载体构建

i. 工具介绍

ii. 如何查看质粒图谱

iii. 基因靶点的选择(CRISPR-GE等线上工具展示)

iv. sgRNA的引物设计

v. 模拟构建(酶切载体/构建体系讲解)

vi. 菌落PCR

vii. 测序鉴定结果分析

2. PE系统的载体构建

i. 引物设计工具的应用

ii. 载体构建演示

iii. 测序结果分析

3. 转染阳性检测

4. 测序原理及结果查看

i. 一代测序原理

ii. Hi-TOM高通量测序

第五天

四. 基因编辑在植物种的应用

1. 基因功能研究

2. 创制新品种

五. 基因编辑在临床上的应用

1. 碱基编辑的临床应用

2. PE系统的临床应用

3. 递送系统的介绍

六. 基因编辑在微生物中的应用

1. 微生物遗传学研究

2. 生物技术(可产生生物燃料/生物塑料/药物等有用的化合物)

七. 机器学习在基因编辑领域的应用

1. 基因编辑结果的预测

2. 编辑效率影响因素的探索

3.基因编辑辅助工具的开发


专题二、机器学习微生物组学


第一天

机器学习及微生物学简介

1. 机器学习基本概念介绍

2. 常用机器学习模型介绍(GLM,BF,SVM,lasso,KNN等等)

3. 混淆矩阵

4. ROC曲线

5. 主成分分析(PCA)

6. 微生物学基本概念

7. 微生物学常用分析介绍

R语言简介及实操

1.R语言概述

2.R软件及R包安装

3.R语言语法及数据类型

4.条件语句

5.循环

第二天

机器学习在微生物学中的应用案例分享

1.利用机器学习基于微生物组学数据预测宿主表

2.利用机器学习基于微生物组学数据预测疾病状态

3.利用机器学习预测微生物风险

4.机器学习研究饮食对肠道微生物的影响

微生物学常用分析(实操)

1. 微生物丰度分析

2. α-diversity,β-diversity分析

3. 进化树构建

4. 降维分析

5. 基于OTU的差异表达分析,热图,箱型图绘制微生物biomarker鉴定

第三天(实操)

零代码工具利用机器学习分析微生物组学数据

1. 加载数据及数据归一化

2. 构建训练模型(GLM, RF, SVM)

3. 模型参数优化

4. 模型错误率曲线绘制

5. 混淆矩阵计算

6. 重要特征筛选

7. 模型验证,ROC曲线绘制利用模型进行预测

第四天(实操)

利用机器学习基于微生物组学数据预测宿主表型(二分类变量以及连续变量)

1. 加载数据(三套数据)

2. 数据归一化

3. OUT特征处理

4. 机器学习模型构建(RF, KNN, SVM, Lasso等9种机器学习方法)

5. 5倍交叉验证

6. 绘制ROC 曲线,比较不同机器学习模型模型性能评估

第五天(实操)

利用机器学习预测微生物风险(多分类)

1.加载数据

2.机器学习模型构建(RF, gbm, SVM, LogitBoost等等)

3.10倍交叉验证

4.模型性能评估

利用机器学习预测刺激前后肠道菌群变化

1.数据加载及预处理

2.α-diversity,β-diversity分析

3. RF模型构建(比较分别基于OUT,KO,phylum的模型效果)

4.10倍交叉验证, 留一法验证

5.特征筛选及重要特征可视化外部数据测试模型

专题三、机器学习转录组学表观组学


第一天

理论部分

高通量测序原理

高通量测序基础

测序方法及数据

二代测序数据分析流程

实操内容

R语言基础

R(4.1.3)和Rstudio的安装

R包安装和环境搭建

数据结构和数据类型

R语言基本函数

数据下载

数据读入与输出

第二天

理论部分

多组学基础

常用生物组学实验与分析方法

常用组学数据库介绍

批量处理组学数据

生物功能分析

基于转录组学的差异基因筛选,疾病预测

组学数据可视化

实操内容

Linux操作系统

Linux操作系统的安装与设置

网络配置与服务进程管理

Linux的远程登录管理

常用的Linux命令

在Linux下获取基因数据

利用Linux探索基因组区域

Shell script与Vim编辑器

基因组文件下载与上传

Linux权限管理

文件的身份

修改文件的所有者和所属组

修改文件权限

第三天

理论部分

介绍转录组学的基本概念和研究流程

RNA-seq数据的预处理和质量控制

序列比对和对齐评估

基因表达量估计和差异表达分析

实操内容

转录组测序数据质量控制

转录组数据比对

RNA-seq数据原始定量

主成分分析

原始定量结果差异分析

差异结果筛选及可视化

GO和KEGG通路富集分析

GSEA基因集富集分析

第四天

理论部分

表观遗传学的基本概念和技术介绍

DNA甲基化和组蛋白修饰的分析方法

表观组数据的预处理和质量控制

差异甲基化和差异修饰分析

甲基化和修饰的功能注释和富集分析

甲基化数据的整合分析和基因调控网络构建

表观组数据的可视化方法和工具

介绍其他表观组学技术(如染色质构象捕获)

实操内容

测序数据质量控制和检查

数据比对和多匹配问题

计算结合峰位置

IGV中组学结果可视化

差异peaks分析

结合程度矩阵计算

富集热图和曲线图绘制

第五天

理论部分

机器学习概述

线性模型

决策树

支持向量机

集成学习

模型选择与性能优化

实操内容

决策树算法实现

随机森林算法实现

支持向量机(SVM)算法实现

朴素贝叶斯算法实现

Xgboost算法实现

聚类算法实现

DBSCAN算法实现

层次聚类算法实现

第六天

理论部分

基因功能注释和富集分析

WGCNA(Weighted Gene Co-expression Network Analysis)网络分析

转录因子分析和调控网络构建

转录组数据的可视化方法和工具

转录水平预测蛋白翻译水平

实操内容

创建Seurat对象

数据质控

测序深度差异及标准化

单细胞数据降维

批次效应去除

数据整合

亚群注释

GSVA通路活性分析

单细胞富集分析

案例图片:

专题四、深度学习基因组学


第一天

理论部分

深度学习算法介绍

1.有监督学习的神经网络算法

1.1全连接深度神经网络DNN在基因组学中的应用举例

1.2卷积神经网络CNN在基因组学中的应用举例

1.3循环神经网络RNN在基因组学中的应用举例

1.4图卷积神经网络GCN在基因组学中的应用举例

2.无监督的神经网络算法

2.1自动编码器AE在基因组学中的应用举例

2.2生成对抗网络GAN在基因组学中的应用举例

实操内容

1.Linux操作系统

1.1常用的Linux命令

1.2 Vim编辑器

1.3基因组数据文件管理, 修改文件权限

1.4查看探索基因组区域

2.Python语言基础

2.1.Python包安装和环境搭建

2.2.常见的数据结构和数据类型

第二天

理论部分

基因组学基础

1.基因组数据库

2.表观基因组

3.转录基因组

4.蛋白质组

5.功能基因组

实操内容

基因组常用深度学习框架

1.安装并介绍深度学习工具包tensorflow, keras,pytorch

2.在工具包中识别深度学习模型要素

2.1.数据表示

2.2.张量运算

2.3.神经网络中的“层”

2.4.由层构成的模型

2.5.损失函数与优化器

2.6.数据集分割

2.7.过拟合与欠拟合

3.基因组数据处理

3.1安装并使用keras_dna处理各种基因序列数据如BED、 GFF、GTF、BIGWIG、BEDGRAPH、WIG等

3.2使用keras_dna设计深度学习模型

3.3使用keras_dna分割训练集、测试集

3.4使用keras_dna选取特定染色体的基因序列等

4.深度神经网络DNN在识别基序特征中应用

4.1实现单层单过滤器DNN识别基序

4.2实现多层单过滤器DNN识别基序

4.3实现多层多过滤器DNN识别基序

第三天

理论部分

卷积神经网络CNN在基因调控预测中的应用

1.Chip-Seq中识别基序特征G4,如DeepG4

2.Chip-Seq中预测DNA甲基化,DeepSEA

3.Chip-Seq中预测转录调控因子结合,DeepSEA

4.DNase-seq中预测染色体亲和性,Basset

5.DNase-seq中预测基因表达eQTL,Enformer

实操内容

复现卷积神经网络CNN识别基序特征DeepG4、非编码基因突变DeepSEA,预测染色体亲和性Basset,基因表达eQTL

1.复现DeepG4从Chip-Seq中识别G4特征

2.安装selene_sdk,复现DeepSEA从Chip-Seq中预测DNA甲基化,非编码基因突变

3.复现Basset,从Chip-Seq中预测染色体亲和性

4.复现Enformer,从Chip-Seq中预测基因表达eQTL

第四天

理论部分

深度学习在识别拷贝数变异DeepCNV、调控因子DeepFactor上的应用

1.SNP微阵列中预测拷贝数变异CNV,DeepCNV

2.RNA-Seq中预测premiRNA,dnnMiRPre

3.从蛋白序列中预测调控因子蛋白质,DeepFactor

实操内容

1.复现DeepCNV利用SNP微阵列联合图像分析识别拷贝数变异

2.复现循环神经网络RNN工具 dnnMiRPre,从RNA-Seq中预测premiRNA

3.复现DeepFactor,从蛋白序列中识别转录调控因子蛋白质

第五天

理论部分

深度学习在识别及疾病表型及生物标志物上的应用

1.从基因表达数据中识别乳腺癌分型的深度学习工具DeepType

2.从高维多组学数据中识别疾病表型,XOmiVAE

3.基因序列及蛋白质相互作用网络中识别关键基因的深度学习工具DeepHE

实操内容

1.复现DeepType,从METABRIC乳腺癌数据中区分乳腺癌亚型

2.复现XOmiVAE,从TCGA多维数据库中识别乳腺癌亚型

3.复现DeepHE利用基因序列及蛋白质相互作用网络识别关键基因

第六天

理论部分

深度学习在预测药物反应机制上的应用

1.联合肿瘤基因标记及药物分子结构预测药物反应机制的深度学习工具SWnet

实操内容

1.预处理药物分子结构信息

2.计算药物相似性

3.在不同数据集上构建self-attention SWnet

4.评估self-attention SWnet

5.构建多任务的SWnet

6.构建单层SWnet

7.构建带权值层的SWnet

案例图片:

专题五、蛋白质晶体解析


第一天

蛋白质结晶前准备

1. 目的蛋白质信息检索(包括实操演示)

1.1 不同种属的蛋白

1.2 蛋白质一级结构的调查

1.3 蛋白质三级结构的预测

1.4 蛋白质理化特性的预测

1.5 蛋白质的配体和共价修饰

2. 分子克隆技术

2.1 目的基因的获取(包括实操演示)

2.2 目的基因的引物设计(包括实操演示)

2.3 传统克隆技术(涉及学习SnapGene软件,包括实操演示)

2.4 无缝克隆技术(涉及学习SnapGene软件,包括实操演示)

以某一基因进行操作演示

3. 利用大肠杆菌表达目的蛋白

3.1 目的蛋白的小量鉴定表达

3.2 目的蛋白的大量表达

3.3 收菌和裂解菌体

3.4 裂解液的离心

3.5 目的蛋白的浓缩

3.6 目的蛋白浓度的测定

4. 真核表达系统

第二天

蛋白质结晶准备

1.蛋白晶体结构的特征

1.1蛋白晶体的空间格子、晶胞和晶面指标

1.2蛋白晶体的对称性、点群、晶系和空间群

2. 蛋白质晶体生长的理论知识(详细讲解温度、pH值、离子强度、有机溶剂、沉淀剂,等等,对蛋白晶体生长的影响;影响蛋白质晶型的因素)

3. 蛋白质晶体生长条件的初筛(详细讲解晶体初筛的注意事项)

4. 蛋白质晶体生长条件的优化 (详细讲解晶体优化的方法,包括改变pH值、沉淀剂,等因素)

5. 晶种法优化蛋白质晶体生长条件

6. 蛋白晶体的挑选和防冻液的配制

第三天

蛋白晶体衍射数据收集

1.X射线衍射

1.1. X射线衍射原理

1.2. X射线衍射的电子密度

1.3. 晶体结构解析的相角问题

2. 上海光源线站BL18U1、BL19U1和BL02U1收集数据的方法 (重点详细讲解,可能需要更长的时间)

3. 蛋白晶体结构解析软件的安装(包括Ubuntu系统、Phenix软件、CCP4软件、PyMoL软件、XDS软件和Adxv软件)

第四天

蛋白晶体结构解析

1. 晶体结构的解析

1.1. 晶体结构解析流程

1.2. Index、Intergrate和Scale

1.3. 分子置换技术(包括实操演示)

1.4. 蛋白晶体结构的重建(包括实操演示)

1.5. 蛋白晶体结构的优化(包括实操演示)

2. 晶体结构的精修(涉及COOT软件、Phenix软件和CCP4软件,包括实操演示)

3. 晶体结构质量的评价指标(详细讲解各个评价指标)

4. 蛋白质结构中加入小分子配体

5. 在结构解析过程中,如何利用软件提高分辨率(重点讲解,需要较长的时间)

第五天

蛋白晶体结构的提交及展示

1. 从晶体生长到解析,详细剖析提高分辨率的方法(包括示例演示)

2. 蛋白晶体结构数据提交到PDB(包括实操演示)

3. 蛋白晶体结构的展示(包括实操演示)

案例图片:

专题六、机器学习代谢组学


第一天

A1 代谢物及代谢组学的发展与应用

(1) 代谢生理功能;

(2) 代谢疾病;

(3) 非靶向与靶向代谢组学;

(4) 空间代谢组学与质谱成像(MSI);

(5) 代谢流与机制研究;

(6) 代谢组学与药物和生物标志物。

A2 代谢组学实验流程简介

A3 色谱、质谱硬件原理

(1) 色谱分析原理;

(2) 色谱的气相、液相和固相;

(3) 色谱仪和色谱柱的选择;

(4) 质谱分析原理及动画演示;

(5) 正、负离子电离模式;

(6) 色谱质谱联用技术;

(7) LC-MS 的液相系统

A4 代谢通路及代谢数据库

(1) 几种经典代谢通路简介;

(2) 能量代谢通路;

(3) 三大常见代谢物库:HMDB、METLIN 和 KEGG;

(4) 代谢组学原始数据库:Metabolomics Workbench 和Metabolights.

第二天

B1 代谢物样本处理与抽提

(1)组织、血液和体液样本的提取流程与注意事项;

(2)用 ACN 抽提代谢物的流程与注意事项;

(3)样本及代谢物的运输与保存问题;

B2 LC-MS 数据质控与搜库

(1)LC-MS 实验过程中 QC 样本的设置方法;

(2)LC-MS 上机过程的数据质控监测和分析;

(3)XCMS 软件数据转换与提峰;

B3 R 软件基础

(1)R 和 Rstudio 的安装;

(2)Rstudio 的界面配置;

(3)R 的基本数据结构和语法;

(4)下载与加载包;

(5)函数调用和 debug;

B4 ggplot2

(1)安装并使用 ggplot2

(2)ggplot2 的画图哲学;

(3)ggplot2 的配色系统;

(4)ggplot2 画组合图和火山图;

第三天

机器学习

C1 无监督式机器学习在代谢组学数据处理中的应用

(1)大数据处理中的降维;

(2)PCA 分析作图;

(3)三种常见的聚类分析:K-means、层次分析与 SOM

(4)热图和 hcluster 图的 R 语言实现;

C2 一组代谢组学数据的降维与聚类分析的 R 演练

(1) 数据解析;

(2) 演练与操作;

C3 有监督式机器学习在代谢组学数据处理中的应用

(1)数据用 PCA 降维处理后仍然无法找到差异怎么办?

(2)PLS-DA 找出最可能影响差异的代谢物;

(3)VIP score 和 coef 的意义及选择;

(4)分类算法:支持向量机,随机森林

C4 一组代谢组学数据的分类算法实现的 R 演练

(1) 数据解读;

(2) 演练与操作;

第四天

D1 代谢组学数据清洗与 R 语言进阶

(1)代谢组学中的 t、fold-change 和响应值;

(2)数据清洗流程;

(3)R 语言 tidyverse

(4)R 语言正则表达式;

(5)代谢组学数据过滤;

(6)代谢组学数据 Scaling 原理与 R 实现;

(7)代谢组学数据的 Normalization;

(8)代谢组学数据清洗演练;

D2 在线代谢组分析网页 Metaboanalyst 操作

(1)用 R 将数据清洗成网页需要的格式;

(2)独立组、配对组和多组的数据格式问题;

(3)Metaboanalyst 的 pipeline 和注意事项;

(4)Metaboanalyst 的结果查看和导出;

(5)Metaboanalyst 的数据编辑;

(6)全流程演练与操作

第五天

E1 机器学习与代谢组学顶刊解读(2-3 篇);

(1)Nature Communication 一篇代谢组学小鼠脑组织样本 database 类型的文献;

(2)Cell 一篇代谢组学患者血液样本的机器学习与疾病判断的文献;

(3)1-2 篇代谢组学与转录组学和蛋白组学结合的文献。

E2 文献数据分析部分复现(1 篇)

(1)文献深度解读;

(2)实操:从原始数据下载到图片复现;

(3) 学员实操。

案例图片:



专题七、CADD计算机辅助药物设计



第一天 上午

背景与理论知识以及工具准备

1.PDB 数据库的介绍和使用

1.1 数据库简介

1.2 靶点蛋白的结构查询与选取

1.3 靶点蛋白的结构序列下载

1.4 靶点蛋白的下载与预处理

1.5 批量下载蛋白晶体结构

2.Pymol 的介绍与使用

2.1 软件基本操作及基本知识介绍

2.2 蛋白质 - 配体相互作用图解

2.3 蛋白 - 配体小分子表面图、静电势表示

2.4 蛋白 - 配体结构叠加与比对

2.5 绘制相互作用力

3.notepad 的介绍和使用

3.1 优势及主要功能介绍

3.2 界面和基本操作介绍

3.3 插件安装使用

下午

一般的蛋白

- 配体分子对接讲解

1. 对接的相关理论介绍

1.1 分子对接的概念及基本原理

1.2 分子对接的基本方法

1.3 分子对接的常用软件

1.4 分子对接的一般流程

2. 常规的蛋白 - 配体对接

2.1 收集受体与配体分子

2.2 复合体预构象的处理

2.3 准备受体、配体分子

2.4 蛋白 - 配体对接

2.5 对接结果的分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

第二天

虚拟筛选

1. 小分子数据库的介绍与下载

2. 相关程序的介绍

2.1 openbabel 的介绍和使用

2.2 chemdraw 的介绍与使用

3. 虚拟筛选的前处理

4. 虚拟筛选的流程及实战演示

案例:筛选新冠病毒主蛋白酶抑制剂

5. 结果分析与作图

6. 药物 ADME 预测

6.1ADME 概念介绍

6.2 预测相关网站及软件介绍

6.3 预测结果的分析

第三天

拓展对接的使用方法

1. 蛋白 -







请到「今天看啥」查看全文