专栏名称: 小张聊科研
聊聊跟科研有关的感想心得,如基金,文章和实验。
目录
相关文章推荐
社会学理论大缸  ·  线上讲座:布迪厄与中国教育研究,7位国际知名 ... ·  20 小时前  
北京大学前沿人  ·  Cell | ... ·  3 天前  
社会学研究杂志  ·  医疗市场化与患者信任——基于各省民营医院发展 ... ·  6 天前  
弗雷赛斯  ·  打破校史!双非师范学院登Science ·  1 周前  
小张聊科研  ·  复旦大学脑科学研究院的这篇14.7分的文章, ... ·  1 周前  
51好读  ›  专栏  ›  小张聊科研

今晚八点准时开播:数据库挖掘的5分文章重现!

小张聊科研  · 公众号  · 科研  · 2017-05-11 16:15

正文

近期在Nature子刊Scientific Reports上看到一篇不错的文章。整个文章中,作者没有做任何“湿实验”,却顺利地发了一篇5分的文章,试问这又是如何做到的呢?



今天,依凡就带领大家,从“数据挖掘”的角度一起来看一下作者是如何实现的吧。


从题目中我们看到,作者研究的研究对象是lncRNA,所用的样本是多种肿瘤组织,研究方法是共表达网分析(co-expression network analysis)。


面对这样的题目,我们大家肯定会想到几个问题

第一,如何获得肿瘤样本?特别是多种不同肿瘤?临床工作者如果要收集肿瘤样本,一般是在自己科室完成,而很难去其他科室收集到不同肿瘤组织。

第二,就算是克服重重困难,获得了肿瘤组织,那下面又该如何研究下去呢?如何获得肿瘤组织中lncRNA的表达?要做全转录组测序吗?

第三,即使花了大价钱,做了测序,那又该如何从这些海量的数据中获得自己想要的信息呢?共表达网络分析又是什么鬼?


面对以上的这些难以克服的难题,作者是如何做的呢?


首先,为了解决数据来源的问题,作者从SRA, ERP这些著名的公共数据库上下载了4个数据集:


然后从数据集出发,开始后续的分析。


从简单的分析入手,例如寻找不同肿瘤组织中共同表达的基因:



找到差异表达基因,绘制热图:

以及高级的共表达网络分析:

以上的这些分析,有些是常用的分析手段,有些是较为高级的分析方法。

是不是觉得很简单很有趣呢,那么问题来了:我们该如何理解这些图表;关键是我们自己如何才能实现这些图表呢?


那么,重点来咯!!!

依凡大大于今晚晚上20:00-21:30,以腾讯课堂的形式先为大家带来一场直播课对该文进行重现。

依凡希望借此能带领大家一起领略数据挖掘的魅力,让你不做实验也能发文章哦。


心动不?激动不?期待不?

快快加入预报名群吧!!!

这是QQ群,可以用微信扫码识别,确认后跳转至QQ


加群的时候,可能由于加入的人很多,所以请多试几次;如果识别不出来,直接在QQ里搜索群号搜索时选择搜索群号:587370175 

大家只需加入一个群即可,以免开课时出现卡机等情况;有问题也可以联系梦熊:qingfengjiyu



机智的彩蛋分割线




依凡老师,小张聊科研团队的资深学霸级顾问,多年从事生物信息学和医学相关研究,主要致力于医学大数据挖掘和软件开发;参与“十二五”,863,973,国自然等多项国家级项目的数据分析内容;拥有丰富交流唠嗑经验,听了依凡大大的课后绝对让你有耳目一新忽然开朗的感觉哟。


直接报名请点击左下“阅读原文


长按二维码识别关注“小张聊科研”

关注后获取《科研修炼手册》1.0、2.0、3.0、4.0、基金篇精华合集