单菌基因组组装、注释、遗传表征、分子分型、系统进化和传播溯源
福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现决定安排扩增子16S分析、宏基因组、单物种转录组、单菌基因组的线上/线下同时开课。报名参加线上直播课的老师可在1年内选择参加同课程的一次线下课 。期待和大家的线上线下会晤。
目前可以通报的信息:
-
单物种转录组线上/线下开课时间:
2025/03/21-22
-
临床基因组线上/线下开课时间:
2025/2/21-23
-
单菌基因组线上/线下开课时间:
2025/3/28-30
-
宏基因组线上/线下开课时间:
2025/5/9-11
-
扩增子线上/线下开课时间:
2025/4/11-13
报名链接:http://www.ehbio.com/Training/
开课背景
微生物 (细菌、病毒和真菌)的全基因组测序 (Whole genome sequencing, WGS)技术已取得了长足的进步,可通过足够低的成本、可观的通量和较短的时间完成。国内外相关的公共数据库也日益充盈,积累了大量的基因组数据和完备的样本信息。此外,随着宏基因组测序越来越普遍,很多研究也不满足于只获取图谱,而是希望对
目标菌进行深入分析
。有了基因组数据及公共数据,如何根据特定的研究目的,运用生物信息学对数据进行整合、分析和解读,成为亟待解决的问题。
课程涵盖内容和适用范围
本课程利用全基因组测序(WGS)数据及生信方法,旨在研究:
属于单个微生物物种 (Intra-specific)的特征菌株或病原体毒株基因组
。
具体是:围绕细菌、病毒或真菌基因组的第二/三代测序数据 (单个或多个分离株,每株分别测序或重测序),完成
基因组组装、基因注释、遗传表征、分子分型、系统进化和传播溯源
。
课程的测试数据来自细菌,但其分析框架也大体适用于病毒、真菌和原生生物。以上物种,具有一般的微生物学特征:个体小、增殖快、易传播;常为单倍体,基因组小;世代周期短,进化/演化迅速。以上特征,使其数据分析具有相似的理论依据和研究目标,例如有条件在单个课程内完成:
从头组装 + 重测序分析
;构建
三类进化树
(普通系统发育树、时间树和传播树)。
对于其它物种,如大型动/植物基因组 (尤其是跨物种),则不适用此课程,原因包括:实施难度 (动/植物基因组的组装难度更大),分析模块 (动/植物无需做传播与溯源分析)及中间数据 (本课程主要利用核心基因组构树,而非同源基因)等。
课程中,原理与实操并重,包括:基本概念、研究案例、采样原则、数据分析、图表输出和结果解读。
适用的人群:微生物学、进化生物学、传染病/流行病学、临床微生物检验、公共卫生领域 (疾控中心)的相关学生或研究人员。
本课程的技术与理论体系,也有助于微生物实验室/课题组:建立系统的基因组分析流程,完善质量管理体系,培养相关生信人才,提示软件、流程及数据库的开发方向和评估方法。
课程资源和模式
-
理论与实操。本课程提供了计算平台 (Linux教学服务器)、课件 (PPT/PDF)、流程代码、生信软件 (仅用于学习;若使用,请引用原作者)、配套数据库、课程直播、视频回看和答疑群。这些软/硬件条件,可帮助学员:快速部署流程,熟悉操作方法,强化编程技能,完善理论学习,提升专业技能。
-
直播与回放。在直播课程上,会带领学员一步步完成数据分析,并穿插讲解课件。在线视频回看不限次数,涵盖全部直播过程。理论配合实操,理解技术要领,利于回顾、审查和优化分析流程。
-
流程和代码。本课程提供搭建好的单菌基因组分析流程,主要基于Linux系统、R语言和部分Python脚本,以应对繁重、批量化的计算任务,同时保持整体分析的灵活性和可重复计算。代码,记录了分析的过程和细节,存档在计算机中,便于使用、回顾、审查、优化、发表和共享。一些在线数据分析与可视化工具,能够简化相对固定的分析模块,可配合使用。
分析流程和课程主线
课程大纲和时间安排
每节课1小时一个主题,理论结合实战,学懂原理,实战操作,全是老司机多年经验和代码的无私分享。下面是课程安排,如11代表第一天第一节课,26代表第二天第六节课。(实际上课时顺序会略有调整)
01、02和03是课前的准备工作 (提前观看软件安装视频,或参加提前进行的软件安装直播)。
编号
|
主题
|
简介
|
01
|
系统与软件
|
Bioconda
,
Git
,
R, Rstudio, R包,PC软件安装等
,
Ubuntu子系统
|
02
|
编程基础
|
Linux系列教程
,
Linux常用命令
, 生信程序基础课节选
|
03
|
Linux软件安装
|
Conda安装与配置, 相关软件安装
|
11
|
组装
|
基本概念, 测序质量评估 (NGS/TGS)
|
12
|
组装
|
全基因组从头 (De novo)组装
|
13
|
组装
|
Nanopore/PacBio组装的NGS纠错
|
14
|
注释
|
基因组草图过滤、排序及评估, 物种鉴定
|
15
|
注释
|
多位点序列分型 (MLST), 表型预测 (耐药/毒力)
|
16
|
注释
|
功能基因注释, 泛基因组分析、构树及绘图
|
21
|
核心基因组
|
序列变异, 基因型, SNP序列比对/对齐
|
22
|
核心基因组
|
计算遗传距离, 去除高频重组区
|
23
|
系统发育树
|
基于SNP构树, 最大似然法 (FastTree/RaxML/IQ-TREE)
|
24
|
系统发育树
|
进化树分簇, 可视化制图
|
25
|
时间树
|
贝叶斯法 (BEAST), 时间刻度树
|
26
|
溯祖
|
推断祖先日期, 贝叶斯天际线图
|
31
|
R统计与绘图
|
R包Ape进化分析, 邻接树, 最小进化树
|
32
|
R统计与绘图
|
遗传距离统计与绘图, 树的注释与关联
|
33
|
溯源
|
传播 (树)与溯源分析
|
34
|
文献案例
|
典型文献及其图形解读
|
课程关键词: 细菌、病毒、真菌全基因组测序;基因组组装与注释;分子遗传与进化;核心基因组;基因组流行病学/暴发流行;传播溯源。
高颜值免费 SCI 在线绘图
(
点击图片直达
)
最全植物基因组数据库IMP
(
点击图片直达
)
往期精品
(
点击图片直达文字对应教程
)