专栏名称: 小张聊科研
聊聊跟科研有关的感想心得,如基金,文章和实验。
目录
相关文章推荐
研之成理  ·  塑料回收,Science! ·  2 天前  
NaturePortfolio  ·  夜空奇观、浴场之憩、圣诞大餐 | ... ·  3 天前  
募格学术  ·  长期挖鼻孔的人,后来都怎么样了 ·  3 天前  
51好读  ›  专栏  ›  小张聊科研

不懂R,怎么分析GEO的数据(2)?

小张聊科研  · 公众号  · 科研  · 2017-07-15 15:05

正文

上期我们介绍了通过GEO2R分析GEO的数据( 不懂R,怎么分析GEO的数据(1)? ),今天我们再来介绍一个好用的工具:


BRB-ArrayTools :https://linus.nci.nih.gov/BRB-ArrayTools/



这个是TCGA官网上附带的一个工具,需要下载安装,

安装后会添加到Excel上,在Excel加载项中可以直接使用:

打开后,我们直接输入GSE85841登录号 E85841

然后单击OK,软件是基于R语言的,单击OK后会下载数据,下载后需要进行Log2转换:

单击后在下面的界面中选择Next:

这样数据就导进来了:

这里我们可以设置最小阈值,默认值是10;标准化方法是quantile,我们选择默认:

这里可以设置差异的倍数,默认的是1.5倍:

我们直接选择默认后单击OK就好了,共有24387个基因符合条件:

然后选择注释方式:用默认的:Annotate data with Bioconductor packages:

再选择基因symbol和物种即可:

这样注释就好了。也可以跳过:


接下来,我们接着可以绘制一系列的图,比如散点图和箱式图:

样本与样本之间:

显示表型之间的,癌症和癌旁的:


接下来是箱式图:


我们再看聚类的热图:

在下面的界面中我们选择欧氏距离:

然后单击OK,这里提示由于基因比较多,需要内存空间比较大,大家需要等一下:

单击“是”后大家等一下就出来了:

接下来我们进行比较:

这样我们就能看到结果了:

这里既有FDR,P value,又有倍数,还有基因的信息。


另外,我们还可以进行SAM分析并寻找差异基因:

结果如下:

另外,我们还可以进行预测分类,比如进行PAM分析:







请到「今天看啥」查看全文