我们在积极地探索为生信领域做贡献的新方法,希望能够给大家提供系统性、形成性、规范性的生信教学。
这次我们邀请到的主讲老师华哥在生信基地完成12月7~8日为期两天的线下教学。在有限的时间里我们完成了"跟着Cell文章源代码学习R语言基础知识"、"跟着Nature文章源代码学习R语言数据结构"、"跟着Cancer cell文章源代码学习转录组数据表达矩阵处理基本处理"、"跟着Nature medicine文章源代码学习生存曲线"的学习。现已把一~四节课的代码数据文件整理打包,并录制了视频回放,大家可以添加小助手微信领取所有资料。小助手1 15951678516(微信同号)
小助手2 18748120945(微信同号)
小助手3 15623525389(微信同号)
下课留念合影:
华哥介绍:中山大学博士,师从加州大学终身教授,深耕于单细胞多组学数据分析和机器学习算法研究,发表过多篇CNS子刊,参与过多项国自然重点、国家重大专项、孔雀计划等项目申报,指导过多篇CNS文章生信分析。2.授课方式采用线上线下相结合,同步进行。线上腾讯会议直播课,互动答疑。线下在南京,现场教学更踏实!
4.深入剖析二十篇CNS文章的分析思路和分析方法,按照CNS文章源代码讲解,以文章的fig为例进行代码演示和复现学习,个性化分析第一节:编程基础学习--R语言
1.R和Rstudio的安装、环境配置
2.R语言简单语法及常见命令
3.以Cell文章方法描述学习R包的安装
4.以Nature文章源代码学习重点函数基础
第二节:编程基础知识---数据结构
1.向量、矩阵、数据框和列表的创建和索引
2.多种数据结构的合并【Cell】
3.自定义Function函数构建
4.for循环、字符型数据的处理【Cell】
第三节:以Nature文章源代码学习转录组数据表达矩阵处理基本处理
1.重复基因和缺失值的删除
2.不同分组样本的批量归类【Nature】
3.多个样本的表达矩阵合并
第四节:以Cell文章源代码学习生存曲线
1.临床预后信息的批量整理
2.创建生存对象、拟合曲线【Cell】
3.特定基因的筛选构建预后分组
4.combat算法不同数据集的批次处理
第五节:差异分析 RNAseq数据分析
1.芯片数据上游分析【Cell】
2.多个样本的数据归一化处理
3.分组矩阵系统讲解【Nature】
4.Deseq2分析流程【Science】
第六节:以多篇CNS文章源代码学习画图
1.ggplot体系画图包括热图
2.火山图 箱线图 小提琴图【Nature】
3.多分组显著性p值添加方法【Nat Med】
4.三维pca图展示差异特征【Science】
5.层次聚类算法区分不同样本特征
第七节:基因集富集分析
1.over representation
2.GSEA 富集 【Cancer Cell】
3.包括自定义基因集的富集分析
4.富集通路网络图【Nat Genet】
第八节:以Nature文章为例系统讲解单细胞转录组基本分析
1.单细胞在CNS文章思路解析及图形解读
2.数据质控、数据放缩、PCA降维、聚类
3.三维tSNE、UMAP可视化【Science】
4.单细胞多组学分析思路和方法
第九节 :单细胞转录组拟时序分析
1.monocle拟时序分析 【Nature】
2.细胞排序,构造一棵生成树
3.基因随轨迹分析变化热图【Cell】
4.BEAM轨迹分支分析【Nature】
5.自测和挖掘单细胞项目思路归纳总结
第十节:空间转录组理论及分析内容
1.空间转录组技术发展历程和原理介绍
2.空间转录组CNS文章思路解析及图解读
3.10x Visium 基本分析流程【Cell】
4.空间数据与单细胞整合分析思路
第十一节课:高分辨空间转录组分析
1.Xenium 空转数据分析【Nature】
2.Visium HD空转数据分析【Cell】
3.Stereo-seq “亚细胞级分辨率”测序介绍
4.空间测序多截面3D邻域重建【Nature】
第十二节课:机器学习基础理论
1.随机森林和支持向量机(SVM)
2.弹性网络回归算法Enet【Cell】
3.广义提升回归模型(GBM)
第十三节课:表观遗传研究
1.ChIP-seq、ATAC-seq在CNS文章中应用
2.ChIP-seq数据分析峰值可视化【Nature】
3.ATAC-seq数据peak注释【Cell】
第十四节:加权基因共表达网络分析 (WGCNA)算法讲解以nature文章为例
1.构建邻接矩阵和拓扑重叠矩阵
2.无尺度网络模型【Nature】
3.共表达调控网络【Cell】
第十五节:免疫浸润计算
1.CIBERSORT反卷积算法,以TCGA数据
2.非监督共识聚类算法【Science】
3.转录因子富集【Cell Stem Cell】
第十六节:大数据分析在基金申请中应用
第十七节:实践课(课程总结,带领学员使用自测数据完成整体分析流程)
第一节:通过两篇Nature文章了解单细胞测序基础原理,解读单细胞测序在癌症、发育及神经科学等领域的研究内容及思路。
第二节:单细胞数据下载、读取、处理,以Cancer Cell文章为例系统讲解单细胞数据质控
第三节:多个样本循环结构整合,使用Harmony和CCA去除批次效应【Nat Genet】
第四节:大型语言模型GPT-4注释细胞类型【Nat Methods】
第五节:Seurat数据结构深入解读及多篇CNS单细胞数据的可视化,3D umap展示【Science】
第六节:利用OR比值查看不同处理组的各单细胞亚群的分布差异【Science】
第七节:Differences in pathway activities scored per cell by GSVA【Nat Med】
第八节:使用VISION算法推断单细胞代谢活性【Cancer Discovery】
第九节:MAGIC 利用流形学习还原单细胞的基因表达【Cell】
第十节:单细胞测序不同分组的相同cluster差异程度3维PCA展示以及差异热图展示【Cell】
第十一节:CellRanger处理单细胞上游数据,loom文件生成,velocyto.R 分析RNA速率【Nature】
第十二节:scVelo三种模型来确定动态变化过程驱动基因【Nat Biotechnol】
第十三节:将velocity 与PAGA联合分析【Nature】
第十四节:CytoTRACE进行拟时间分析,基因表达量随PC1轴的变化 【Cell】
第十五节:3D Diffusion Pseudotime Analysis diffusion component【Cell Stem Cell】
第十六节:Monocle2拟时间与CytoTRACE结合的个性化绘图【Nat Med】
第十七节:Monocle3在三维空间轨迹与scVelo结合 【Nature】
第十八节:SCEVAN表征细胞的克隆结构【Science】
第十九节:inferCNV结合UPhyloplot2分析肿瘤进化
第二十节:CellPhoneDB v.3.0系统讲解细胞互作和个性化作图展示【Nat Genet】
第二十一节:CellChat多分组数据集差异分析【Nat Med】
第二十二节:NicheNet to link ligands from cells in TME and the EMT program in tumor cells.【Cancer Cell】
第二十三节:使用SCENIC进行转录调控网络分析和核心驱动基因鉴定【Nat Med】
第二十四节:NMF鉴定不同的生物学功能【Cell】,不同cluster的异质性确定【Cancer Cell】
第二十五节:PHATE同时保留局部结构(local structure) 以及全局结构(global structure)对单细胞数据降维【Nature】
第二十六节:scRNA-seq和bulk RNA-seq数据联合分析推断细胞类群互作网络【Cell】
第二十七节:scATAC-seq分析Sequence motif enrichment and Transcription factor footprinting 【Nat Genet】
第二十八节:以Nature文章为例系统讲解scRNA-seq与scATAC-seq联合分析【Nat Genet】
第二十九节:CITE–seq对单细胞转录组和膜蛋白进行定量分析【Nat Med】
第三十节:实践课一(课程总结,带领学员使用自测数据完成整体分析流程)第三十一节:实践课二(课程总结,带领学员使用自测数据完成整体分析流程)
第一节:Python编程语言入门
1.Spyder和Anaconda安装
2.环境配置;基本语法、数据类型等
3.Python控制流与函数(条件语句、循环语句、函数定义、返回值)
第二节:Python数据结构进阶
1.列表、元组、字典、集合高级用法
2.Python常用的包(numpy、pandas、matplotlib等)
3.了解Shell,基础命令学习(文件操作、权限管理)
第三节:空间转录组在CNS文章应用
1.空间转录组CNS文章思路解析
2.空间转录组技术在科研领域的应用
3.空间转录组技术在不同科学等领域的研究内容及思路及常见图形解读
第四节:以Nature Genetics文章源代码为例,系统学习squidpy和scanpy的系统分析
1.常规空间转录组数据读取
2.数据质控--scrublet去除双细胞
第五节:反卷积算法--空间注释-【Science】源代码
1.CCA锚定算法--【Nature】源代码
2.非负矩阵分解和非负最小二乘
3.深度学习框架--Tangram
第六节:Cell2location采用贝叶斯层次框架--整合单细胞和空转数据--【Cell】源代码
1.计算单细胞细胞类型的表达特征
2.训练模型--【Sci Transl Med】源代码
第七节:Hotspot识别空间数据集中信息基因(和基因模块)探索空间组织微环境【Nat Genet】
1.计算 KNN 图--【Nat Genet】源代码
2.查找信息基因,将基因分组到模块
3.评估成对基因关联
4.其他文章解读--【Nat Med】源代码
第八节:Banksy--深入地理解细胞间的相互作用和组织构造【Science】
1.空转数据分析之生态位聚类算法Banksy
2.空间转录组学数据中细胞邻居依赖性基因表达的新方法【Neuron】
3.根据微环境对细胞进行分类,CellNeighborEX 使用直接细胞定位
第九节:表达增强:BayesSpace--利用空间转录组数据中的邻域结构来增加子点级别分辨率的计算方法【Nat Commun】
1.TESLA--利用神经网络CNN算法提高空间转录组的分辨率【Cell】
第十节:Giotto|| 空间表达数据分析工具箱【Mol Cell】
1.PAGE--单细胞数据注释空转的spot
2.spatital patterns 提取连续的空间表达模式分析【Nature】
3.cell neighborhood 空间和配受体表达计算细胞空间相互作用
第十一节:空间转录组数据三大矩阵分析(重点讲解niche矩阵)
1.基因表达矩阵【Nature Metab】
2..细胞类型矩阵【Nature Aging】
3.细胞生态位矩阵【Cancer Cell】
第十二节:空间分子生态位差异分析---Niche-DE以【Cancer Cell】源代码
1.空转数据中的生态位差异基因表达分析
2.可识别上下文依赖性细胞间相互作用
3.Effective Niche Calculation
第十三节:空间基因模式 系统学习三类识别空间高变基因的方法--【Nat Methods】
1.基于Python的SpatialDE
2.基于R语言的trendsceek 【Nature】
3.SPARK-X--广义线性空间模型
第十四节:空间转录组的轨迹分析--【Cancer Cell】源代码
1.stlearn:基于全组织SME均一化的PAGA轨迹分析【Immunity】
2.SPATA:空间背景下不同表达的基因和基因集轨迹变化【Cell】
3.CytoTRACE进行发育起点推断
第十五节:MISTy--空间细胞共定位
1.MISTy不仅可以做细胞-细胞之间的dependency【Nat Med】
2.基因和基因之间、细胞和通路之间的dependency【Immunity】
第十六节:COMMOT--细胞间通讯
1.利用最优运输进行空间转录组细胞间通讯分析【Cell】
2.推断的信号传导与已知下游基因活性相关性【Nat Genet】第十七节:空间转录组速率分析--SIRV以【Nat Med】源代码
1.单细胞分辨率推断空间 RNA 速度
2.空间转换张量方法重建空间数据中的细胞吸引子【Cell】
第十八节:空间细胞网络构建--cell degree以Cell源代码讲解
1.构建空间近邻网络【Nat Commun】
2.在空间领域展示细胞网络【Cell】
第十九节:肿瘤克隆空间演化--空间肿瘤细胞CNV--【Nature】
1. siCNV 分析并构建了克隆进化树
2.空间克隆分布与 Gleason 分级相关性
3.CopyKAT肿瘤推断个性化展示【JCI】
第二十节:空间区域组织模块发现以【Nat Med】源代码
1.深度学习框架的人工智能算法 SPACE
2.能够从空间转录组数据中识别空间细胞类型和发现组织模块
第二十一节:细胞互作分析 -- NicheNet、CellChat
1.CellChat各种图形可视化【Cell】
2.NicheNet分析配体对下游基因调控
第二十二节:MIA---多模态数据取交集方法进行单细胞和空间转录组联合分析
1.针对Spot Cluster 水平上利用单细胞注释信息来对ST-Spot聚类结果进行细胞类型注释。【Nature Metab】
第二十三节:空转数据可视化semla以【Nature】源代码
第二十四节:利用pyVIPER算法来定量单细胞蛋白的活性【Cell】
1.检查谱系特异性基因调控网络
2.基因表达特征转换为蛋白质活性矩阵
3.在蛋白质活性水平上分析单细胞
第二十五节:GeneTrajectory算法的单细胞基因轨迹推断【Science】
1.构建一个细胞到细胞的 kNN 图
2.计算基因分布之间基于成对图的 Wasserstein 距离
3.基因-基因 Wasserstein 距离矩阵,确定基因沿每个基因轨迹的顺序
第二十六节:系统学习pySCENIC转录调控网络,网络特异性评分,转录调控网络和轨迹联合分析【Cell Stem Cell】
1.以Cell文章系统讲解pySCENIC源代码
2.以Nat Med多形式可视化调控单元
第二十七节:Visium HD空转数据在R和Python中的运行【Science】源代码
1.Python的scanpy分析Visium HD数据
2.R语言的Seurat分析Visium HD数据第二十八节:实践课一(课程总结,带领学员使用自测数据完成整体分析流程)
1.实战答疑
关注下方公众号获取更多生信知识