萌新初入组学大门,转录组是大多数科研人研究标配。从老板或师兄师姐处接手RNA-seq测序的基因定量表后,一开始都不免感到些许迷茫:
分享
引用量破4500+
的超好用交互式在线数据分析可视化工具平台
OmicShare
,适配99%生命科学研究人员,可轻松完成各大常规组学分析的发表级结果图直出,无需掌握晦涩编程基础或分析理论,只需整理并提交数据即可轻松搞定!
那么转录组常规流程数据怎么挖?需要拿捏哪些可视化图表?下面带你轻松搞定!
基于表达量丰度矩阵,可以先绘制一波小提琴图或山峦图,展示不同样本中基因丰度分布,评估样本在建库、测序、比对或定量中的差异。OmicShare中的动态山峦图和动态小提琴图都支持动态交互,参数配色都可随意调整。
https://www.omicshare.com/tools/home/report/reportridgeplot.html
https://www.omicshare.com/tools/home/report/reportviolin2.html
如何保证结果的准确性呢?主成分分析(PCA)+样本相关性分析搞定!通过了解样本间的相似性/重复性,可证明结果的可靠度,同时也用于离群样本和异常值的剔除。
https://www.omicshare.com/tools/home/report/reportpca.html
通过降维,将样本中上万维度的信息变换为数个维度的综合指标(主成分),根据各样本在第一主成分(PC1)和第二主成分(PC2)两个综合指标中的数值大小,绘制二维散点。如下图,相似的样本会聚集在一起,距离越近,相似度越高。
输入矩阵无行列数限制,适合大样本等,可输出分析结果表,热图不支持交互;
https://www.omicshare.com/tools/Home/Soft/ica
输入矩阵行列数有限制,热图支持动态交互;
https://www.omicshare.com/tools/Home/Soft/getsoft
计算样本间的两两相关性系数(pearson/spearman),以热图形式进行直观展现。若系数越接近1,则说明样本间的表达模式越相似。
OmicShare动态相关性热图(组内)绘制示例
差异分析,以生物学意义的方式定性基因表达量,计算两个比较组的基因表达差异倍数(Fold change),得到显著性P值,然后通过多重假设检验矫正筛选出具有统计学意义的显著差异表达基因,从而为我们挑选目标基因缩小范围,再将结果与后续分析点相结合,如富集分析等,以探究相关的生物学过程和分子机制。
https://www.omicshare.com/tools/Home/Soft/diffanalysis
edgeR、DESeq2如何选择?首先二者输入数据都为基因表达丰度矩阵(reads counts),基于负二项分布模型进行检验。不同之处在于,
edgeR
使用TMM标准化,可用于
无生物学重复样本
;
DESeq2
使用DESeq标准化,
需要提供生物学重复
。使用OmicShare差异分析,除了可以得到
完整的差异分析结果表
,还提供所有比较组的
差异统计柱状图
和
火山图
,如下:
OmicShare差异分析工具绘制示例
通过
柱状图
,可以直观地看到组内组间上调和下调的差异基因数量,
火山图
则将统计显著性数值-log10(FDR/Pvalue)和差异倍数log2FC相结合,辅助识别变化幅度较大且具有统计学意义的差异基因。
针对差异分析结果表,还可以结合自己的背景需求,进一步重新绘制更加个性化、美观的火山图,如自由更改配色,修改散点大小、不透明度、图表标注目标id标签等。
https://www.omicshare.com/tools/home/report/reportvolcano.html
文章中的OmicShare动态火山图绘制实例
(
Cardiovasc Diabetol
,2024,IF = 8.5)
常规火山图的局限在于,同一图表仅支持一个比较组的展示,如果比较组较多,可以选择绘制
多组差异火山图
(多组差异散点图):
https://www.omicshare.com/tools/home/report/report_diff_scatter_chart.html
在多组差异火山图中,以组间差异倍数的对数值log2FC为纵坐标,以比较组的名称为横坐标,可完美地在一张图中一次性展示多个比较组的差异基因:
OmicShare动态多组差异散点图绘制示例
在完成差异分析后,可使用双向聚类热图展示差异基因在不同样本中的表达模式。对样本聚类,可反映样品重复性好坏;对基因聚类,可反应功能相似性,表达模式相似的基因可能具有共同的功能或参与到共同的代谢途径及信号通路。
https://www.omicshare.com/tools/home/report/reportheatmap.html
OmicShare动态热图工具绘制示例
https://www.omicshare.com/tools/Home/Soft/getsoft/type/heatmap
OmicShare热图工具绘制示例
https://www.omicshare.com/tools/home/report/reportvenn.html
使用韦恩图,可展示共有或特有基因集情况。在OmicShare动态韦恩图中,存在2-5个差异比较组时,交集为共同调控的基因集,差集则为特定调控的基因集,可结合个人背景挖掘所需。此外,当组别数超过6组时,默认绘制花瓣韦恩图,即只展示各组中的特有元素。
OmicShare动态韦恩图绘制示例
PS:OmicShare还支持特色韦恩图如
比例韦恩图、网络韦恩图、Upset维恩图
的绘制。
如果实验设计或样本设计存在
梯度关系
,此时还可以选择使用趋势分析(Series Test of Cluster),将表达趋势相同的基因进行归类,缩小分析范围,聚焦到具有相同表达模式的基因上。
趋势分析:
https://www.omicshare.com/tools/Home/Soft/trend
https://www.omicshare.com/tools/home/report/reporttrend.html
最后,基于差异基因集或候选基因集列表进行功能富集,找到目标通路,进而挖掘到所需的核心基因!传统富集分析数据库有KEGG、GO、Reactome和Do,可根据自己研究背景所需选择1个或多个,此外还可以选择GSEA。
在OmicShare使用富集分析工具,直接提交候选基因集列表,选择平台内对应物种(平台内置常见18大模式物种背景基因文件),或自行准备背景基因文件,即可一键完成富集分析,同时相关发表级图表同步输出!
KEGG富集分析:
https://www.omicshare.com/tools/Home/Soft/pathwaygseasenior
https://www.omicshare.com/tools/home/report/koenrich.html
https://www.omicshare.com/tools/Home/Soft/gogseasenior