趋势分析(Series Test of Cluster)是基因表达分析中的常见方法,主要用来挖掘具有相同表达模式的基因。之前介绍过,使用OmicShare的趋势分析工具可以轻松完成基于STEM方法的目的基因挖掘,如下,详情可查看
《师兄,师兄,趋势分析怎么做?》
一文。
最近,OmicShare的动态趋势分析工具迎来重大更新,新增支持基于Mfuzz方法的趋势分析功能。Mfuzz主要基于模糊聚类(Soft clustering)算法的进行趋势分析,聚类效果如下图E,与之前的STEM方法(一般3~5个时间点)相比,Mfuzz方法可支持更多时间点(分组)的数据。
(Cell, 2015)
那么,如何使用新版本的动态趋势分析工
具进行基
因挖掘呢?
趋势分析的范例数据格式如下图,第1列为gene id,之后的列为相应时间点(分组)的基因表达量数据(如FPKM值,组内生物学重复数据取均值),你也可以使用趋势分析工具自带的示例文件进行练习。
工具的用法很简单,点击
选择文件
按钮上传表达量数据文件,聚类算法选择Mfuzz,生成的趋势模块数量这里设置为15个,数据的预处理方法选择
标准化
,然后点击
提交
按钮。
工具链接:
https://www.omicshare.com/tools/home/report/reporttrend.html
关于数据预处理,工具提供了三种标准化方法:“
Log2标准化
”、“
标准化
”(默认)和“
不做标准化/加0
” 。对于这三种数据处理方法,如果是表达量数值,如FPKM值,推荐使用“标准化”选项,也就是Z-score算法;如果是差异倍数数值(FC值),推荐选“Log2标准化”选项;如果是已经取过对数的差异倍数数据(如Log2FC值)推荐选择“不做标准化/加0”选项。
大约数秒后,在结果展示区域点击
刷新项目状态
按钮查看相应的分析结果,初始的结果如下图。
接着添加Y轴坐标轴标题,并选择隐藏图例,如下图。
当然,如果对图表的默认配色不满意,我们也可以自定义配色,如下图。
另外,还可以调整趋势组合图表的排列方式,比如我们可以将每行的趋势列数调整为4列,如下图。
如果对某个趋势(Cluster)感兴趣,可通过
参数profile
选择单独显示相应趋势的图表,如下图,这里选择单独显示
profile15
,在下方表格中勾选感兴趣的目的基因,就可在图表上单独展示这些基因的表达趋势。
通过图片尺寸调整选项窗口修改图片的比例,如下图,满意后可将图表保存为SVG或PDF格式的矢量图,之后还可以继续对图片进行后期调整。
最后,在项目总览页面,我们也可以下载全部的分析结果数据,表格包含每个基因对应的趋势编号(Cluster值)、Membership值等,使用该表格可以直接使用其他工具进行更加个性的图表绘制。
好啦,本次的趋势分析教程就分享到这里啦!
基迪奥生物
是定制化组学测序与生物信息分析服务领域的领先者,公司组学服务涉及单细胞组学、空间组学、翻译组、基因组等40条业务线,欢迎留言咨询!
长按识别二维码填写意向