专栏名称: 基迪奥生物
广州基迪奥生物官方公众平台,小圆每天分享各种生信软件使用技巧, 搜罗好玩的科研生活,定期还有掉节操的生物界八卦分享,让科研变得有意思咯~
目录
相关文章推荐
金城江悠然网  ·  “比价神器”上线,买药必看! ·  3 天前  
金城江悠然网  ·  “比价神器”上线,买药必看! ·  3 天前  
51好读  ›  专栏  ›  基迪奥生物

带你轻松搞定转录组数据挖掘与发表级绘图!

基迪奥生物  · 公众号  ·  · 2024-09-24 18:05

正文

萌新初入组学大门,转录组是大多数科研人研究标配。从老板或师兄师姐处接手RNA-seq测序的基因定量表后,一开始都不免感到些许迷茫:
下游数据怎么挖?
超级多的分析点的算法看不懂点解?
不会编程代码如何绘图?
如何绘制高度个性化的发表级图表……

分享 引用量破4500+ 的超好用交互式在线数据分析可视化工具平台 OmicShare ,适配99%生命科学研究人员,可轻松完成各大常规组学分析的发表级结果图直出,无需掌握晦涩编程基础或分析理论,只需整理并提交数据即可轻松搞定!

那么转录组常规流程数据怎么挖?需要拿捏哪些可视化图表?下面带你轻松搞定!

1


表达量丰度分布展示

基于表达量丰度矩阵,可以先绘制一波小提琴图或山峦图,展示不同样本中基因丰度分布,评估样本在建库、测序、比对或定量中的差异。OmicShare中的动态山峦图和动态小提琴图都支持动态交互,参数配色都可随意调整。

1

山峦图

https://www.omicshare.com/tools/home/report/reportridgeplot.html
OmicShare动态山峦图绘制示例

2

小提琴图

https://www.omicshare.com/tools/home/report/reportviolin2.html

OmicShare动态小提琴图绘制示例

2


样本关系分析

如何保证结果的准确性呢?主成分分析(PCA)+样本相关性分析搞定!通过了解样本间的相似性/重复性,可证明结果的可靠度,同时也用于离群样本和异常值的剔除。

1

PCA分析

https://www.omicshare.com/tools/home/report/reportpca.html

通过降维,将样本中上万维度的信息变换为数个维度的综合指标(主成分),根据各样本在第一主成分(PC1)和第二主成分(PC2)两个综合指标中的数值大小,绘制二维散点。如下图,相似的样本会聚集在一起,距离越近,相似度越高。

OmicShare PCA工具绘制示例

2

组内相关性分析

输入矩阵无行列数限制,适合大样本等,可输出分析结果表,热图不支持交互;

https://www.omicshare.com/tools/Home/Soft/ica


输入矩阵行列数有限制,热图支持动态交互;

https://www.omicshare.com/tools/Home/Soft/getsoft


计算样本间的两两相关性系数(pearson/spearman),以热图形式进行直观展现。若系数越接近1,则说明样本间的表达模式越相似。


OmicShare动态相关性热图(组内)绘制示例


3


差异表达分析

1

DESeq2/edgeR差异分析

差异分析,以生物学意义的方式定性基因表达量,计算两个比较组的基因表达差异倍数(Fold change),得到显著性P值,然后通过多重假设检验矫正筛选出具有统计学意义的显著差异表达基因,从而为我们挑选目标基因缩小范围,再将结果与后续分析点相结合,如富集分析等,以探究相关的生物学过程和分子机制。

https://www.omicshare.com/tools/Home/Soft/diffanalysis


edgeR、DESeq2如何选择?首先二者输入数据都为基因表达丰度矩阵(reads counts),基于负二项分布模型进行检验。不同之处在于, edgeR 使用TMM标准化,可用于 无生物学重复样本 DESeq2 使用DESeq标准化, 需要提供生物学重复 。使用OmicShare差异分析,除了可以得到 完整的差异分析结果表 ,还提供所有比较组的 差异统计柱状图 火山图 ,如下:


OmicShare差异分析工具绘制示例


通过 柱状图 ,可以直观地看到组内组间上调和下调的差异基因数量, 火山图 则将统计显著性数值-log10(FDR/Pvalue)和差异倍数log2FC相结合,辅助识别变化幅度较大且具有统计学意义的差异基因。


2

火山图

针对差异分析结果表,还可以结合自己的背景需求,进一步重新绘制更加个性化、美观的火山图,如自由更改配色,修改散点大小、不透明度、图表标注目标id标签等。

https://www.omicshare.com/tools/home/report/reportvolcano.html


文章中的OmicShare动态火山图绘制实例

Cardiovasc Diabetol ,2024,IF = 8.5)

3

多组差异火山图

常规火山图的局限在于,同一图表仅支持一个比较组的展示,如果比较组较多,可以选择绘制 多组差异火山图 (多组差异散点图):

https://www.omicshare.com/tools/home/report/report_diff_scatter_chart.html


在多组差异火山图中,以组间差异倍数的对数值log2FC为纵坐标,以比较组的名称为横坐标,可完美地在一张图中一次性展示多个比较组的差异基因:


OmicShare动态多组差异散点图绘制示例


4

热图

在完成差异分析后,可使用双向聚类热图展示差异基因在不同样本中的表达模式。对样本聚类,可反映样品重复性好坏;对基因聚类,可反应功能相似性,表达模式相似的基因可能具有共同的功能或参与到共同的代谢途径及信号通路。

https://www.omicshare.com/tools/home/report/reportheatmap.html


OmicShare动态热图工具绘制示例


https://www.omicshare.com/tools/Home/Soft/getsoft/type/heatmap


OmicShare热图工具绘制示例


4


候选基因集筛选

如果存在多个差异比较组,可进行候选基因集的筛选。

1

韦恩图

https://www.omicshare.com/tools/home/report/reportvenn.html


使用韦恩图,可展示共有或特有基因集情况。在OmicShare动态韦恩图中,存在2-5个差异比较组时,交集为共同调控的基因集,差集则为特定调控的基因集,可结合个人背景挖掘所需。此外,当组别数超过6组时,默认绘制花瓣韦恩图,即只展示各组中的特有元素。


OmicShare动态韦恩图绘制示例


PS:OmicShare还支持特色韦恩图如 比例韦恩图、网络韦恩图、Upset维恩图 的绘制。


2

趋势分析

如果实验设计或样本设计存在 梯度关系 ,此时还可以选择使用趋势分析(Series Test of Cluster),将表达趋势相同的基因进行归类,缩小分析范围,聚焦到具有相同表达模式的基因上。

趋势分析: https://www.omicshare.com/tools/Home/Soft/trend

动态趋势分析:
https://www.omicshare.com/tools/home/report/reporttrend.html

OmicShare动态趋势分析绘制示例

5


核心基因挖掘—功能富集分析

最后,基于差异基因集或候选基因集列表进行功能富集,找到目标通路,进而挖掘到所需的核心基因!传统富集分析数据库有KEGG、GO、Reactome和Do,可根据自己研究背景所需选择1个或多个,此外还可以选择GSEA。

1

KEGG/GO富集分析

在OmicShare使用富集分析工具,直接提交候选基因集列表,选择平台内对应物种(平台内置常见18大模式物种背景基因文件),或自行准备背景基因文件,即可一键完成富集分析,同时相关发表级图表同步输出!

KEGG富集分析:

https://www.omicshare.com/tools/Home/Soft/pathwaygseasenior

动态KEGG富集分析 (图表可动态交互):
https://www.omicshare.com/tools/home/report/koenrich.html

OmicShare KEGG富集分析绘制示例

GO富集分析:
https://www.omicshare.com/tools/Home/Soft/gogseasenior






请到「今天看啥」查看全文


推荐文章
金城江悠然网  ·  “比价神器”上线,买药必看!
3 天前
金城江悠然网  ·  “比价神器”上线,买药必看!
3 天前
DeepTech深科技  ·  我们该如何证明自己存在?
8 年前