专栏名称: 生信宝典
生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程;高通量测序数据分析学习教程;生信软件安装教程。所有内容均为原创分享,致力于从基础学习到提高整个过程。
目录
相关文章推荐
BioArt  ·  Immunity | 记忆CD8+ ... ·  昨天  
生信宝典  ·  新课上线 | ... ·  2 天前  
生物学霸  ·  深圳医学科学院分子认知实验室诚聘英才 ·  3 天前  
51好读  ›  专栏  ›  生信宝典

新课上线 | 单菌基因组组装、注释、遗传表征、分子分型、系统进化和传播溯源

生信宝典  · 公众号  · 生物  · 2024-12-25 21:00

正文

单菌基因组组装、注释、遗传表征、分子分型、系统进化和传播溯源

福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现决定安排扩增子16S分析、宏基因组、单物种转录组、单菌基因组的线上/线下同时开课。报名参加线上直播课的老师可在1年内选择参加同课程的一次线下课 。期待和大家的线上线下会晤。

目前可以通报的信息:

  1. 单物种转录组线上/线下开课时间:

    2024/12/27-29,   2025/03/21-23

  2. 临床基因组线上/线下开课时间:

    2025/2/21-23

  3. 单菌基因组线上/线下开课时间:

    2025/1/10-12

  4. 宏基因组线上/线下开课时间:

    2025年5月9-11

  5. 扩增子线上/线下开课时间:

    2025/4/11-13

报名链接:http://www.ehbio.com/Training/

开课背景

微生物 (细菌、病毒和真菌)的全基因组测序 (Whole genome sequencing, WGS)技术已取得了长足的进步,可通过足够低的成本、可观的通量和较短的时间完成。国内外相关的公共数据库也日益充盈,积累了大量的基因组数据和完备的样本信息。此外,随着宏基因组测序越来越普遍,很多研究也不满足于只获取图谱,而是希望对目标菌进行深入分析。有了基因组数据及公共数据,如何根据特定的研究目的,运用生物信息学对数据进行整合、分析和解读,成为亟待解决的问题。

课程涵盖内容和适用范围

本课程利用全基因组测序(WGS)数据及生信方法,旨在研究:属于单个微生物物种 (Intra-specific)的特征菌株或病原体毒株基因组

具体是:围绕细菌、病毒或真菌基因组的第二/三代测序数据 (单个或多个分离株,每株分别测序或重测序),完成基因组组装、基因注释、遗传表征、分子分型、系统进化和传播溯源

课程的测试数据来自细菌,但其分析框架也大体适用于病毒、真菌和原生生物。以上物种,具有一般的微生物学特征:个体小、增殖快、易传播;常为单倍体,基因组小;世代周期短,进化/演化迅速。以上特征,使其数据分析具有相似的理论依据和研究目标,例如有条件在单个课程内完成:从头组装 + 重测序分析;构建三类进化树 (普通系统发育树、时间树和传播树)。

对于其它物种,如大型动/植物基因组 (尤其是跨物种),则不适用此课程,原因包括:实施难度 (动/植物基因组的组装难度更大),分析模块 (动/植物无需做传播与溯源分析)及中间数据 (本课程主要利用核心基因组构树,而非同源基因)等。

课程中,原理与实操并重,包括:基本概念、研究案例、采样原则、数据分析、图表输出和结果解读。

适用的人群:微生物学、进化生物学、传染病/流行病学、临床微生物检验、公共卫生领域 (疾控中心)的相关学生或研究人员。

本课程的技术与理论体系,也有助于微生物实验室/课题组:建立系统的基因组分析流程,完善质量管理体系,培养相关生信人才,提示软件、流程及数据库的开发方向和评估方法。

课程资源和模式

  1. 理论与实操。本课程提供了计算平台 (Linux教学服务器)、课件 (PPT/PDF)、流程代码、生信软件 (仅用于学习;若使用,请引用原作者)、配套数据库、课程直播、视频回看和答疑群。这些软/硬件条件,可帮助学员:快速部署流程,熟悉操作方法,强化编程技能,完善理论学习,提升专业技能。

  2. 直播与回放。在直播课程上,会带领学员一步步完成数据分析,并穿插讲解课件。在线视频回看不限次数,涵盖全部直播过程。理论配合实操,理解技术要领,利于回顾、审查和优化分析流程。

  3. 流程和代码。本课程提供搭建好的单菌基因组分析流程,主要基于Linux系统、R语言和部分Python脚本,以应对繁重、批量化的计算任务,同时保持整体分析的灵活性和可重复计算。代码,记录了分析的过程和细节,存档在计算机中,便于使用、回顾、审查、优化、发表和共享。一些在线数据分析与可视化工具,能够简化相对固定的分析模块,可配合使用。

分析流程和课程主线

课程大纲和时间安排

每节课1小时一个主题,理论结合实战,学懂原理,实战操作,全是老司机多年经验和代码的无私分享。下面是课程安排,如11代表第一天第一节课,26代表第二天第六节课。(实际上课时顺序会略有调整)

01、02和03是课前的准备工作 (提前观看软件安装视频,或参加提前进行的软件安装直播)。

编号主题简介
01系统与软件Bioconda, Git, R, Rstudio, R包,PC软件安装等, Ubuntu子系统
02编程基础Linux系列教程, Linux常用命令, 生信程序基础课节选
03Linux软件安装Conda安装与配置, 相关软件安装
11组装基本概念, 测序质量评估 (NGS/TGS)
12组装全基因组从头 (De novo)组装
13组装Nanopore/PacBio组装的NGS纠错
14注释基因组草图过滤、排序及评估, 物种鉴定
15注释多位点序列分型 (MLST), 表型预测 (耐药/毒力)
16注释功能基因注释, 泛基因组分析、构树及绘图
21核心基因组序列变异, 基因型, SNP序列比对/对齐
22核心基因组计算遗传距离, 去除高频重组区
23系统发育树基于SNP构树, 最大似然法 (FastTree/RaxML/IQ-TREE)
24系统发育树进化树分簇, 可视化制图
25时间树贝叶斯法 (BEAST), 时间刻度树
26溯祖推断祖先日期, 贝叶斯天际线图
31R统计与绘图R包Ape进化分析, 邻接树, 最小进化树
32R统计与绘图遗传距离统计与绘图, 树的注释与关联
33溯源传播 (树)与溯源分析
34文献案例典型文献及其图形解读

课程关键词: 细菌、病毒、真菌全基因组测序;基因组组装与注释;分子遗传与进化;核心基因组;基因组流行病学/暴发流行;传播溯源。




高颜值免费 SCI 在线绘图(点击图片直达)


最全植物基因组数据库IMP (点击图片直达)

往期精品(点击图片直达文字对应教程)

机器学习