专栏名称: 解螺旋
解螺旋——医生科研最好的帮手。无论你是科研零基础,抑或初窥门径,你都可以在解螺旋获得极大的提升,从而面对基金、论文、实验游刃有余。解螺旋课堂是所有热爱科研技能学习的医生聚集地,解螺旋会员是医生科研全方位的贴心助手,加入我们,体验改变。
目录
相关文章推荐
医脉通临床指南  ·  高危人群如何进行结核病的预防性治疗? ·  4 天前  
51好读  ›  专栏  ›  解螺旋

一个集合了TCGA、PubMed、KEGG、transfac……的基因查询工具 是怎样的存在

解螺旋  · 公众号  · 医学  · 2017-08-24 17:59

正文

做科研有三种痛不能忍,一种是脑袋空空没思路,二是辛辛苦苦没成果,三是别人轻轻松松发文章。今儿先和大家聊聊课题思路方面的事儿,今天主题我们选了基因研究,为啥?生信火,大数据火,这两个都绕不开基因。


所以你的日常可能是这样的:

1

花了老大笔钱测了序,筛了一堆让人傻眼的基因,接下去怎么做?

2

挖了数据分析了半天,还是一堆看不出所以然的基因,接下去呢?

3

看文献相中了一个感兴趣的基因,那我可不可以就做这一个?


归纳一下就两个问题:1、怎么确定一个基因可以做;2、基因研究该怎么做。


这两个问题也是老生常谈了,但攻略干货看起来简单,回归到实际问题还是得文献数据库来回翻。今天就来解决点实际问题:


看看如何快速判断一个基因是否值得做,怎么做。


用到的一个懒人工具——基因雷达,非常适合文献和数据库不对付的亲,只要输入你感兴趣的基因,基因的科研热度,相关疾病,调控网络和在癌症中的表达值四个层面就全出来了。似乎从此可以脱离苦海了。


1

如何省时省力确定一个基因可以做


先看差异表达

比如说你翻翻翻文献看到了一个还不错的基因CCL5(PMID:17914389,乳腺癌),也想研究下,但自己没有数据,不知道这个基因在你研究中的疾病到底是个什么情况。


不用翻TCGA,你就可以在基因雷达中中查看CCL5在33种肿瘤中正常组织和癌组织的表达情况。在工具中输入CCL5,选择表达概况,就可以得到下面的结果。

(点开看大图)

PS:表达概况是基于TCGA的RNA-SEQv2数据中的标准化数据文件中的表达值进行直接使用(数据收集时间为2016年6月)。


CCL5在乳腺癌转移中有重要作用,通过下面数据可以推测CCL5在某些肿瘤中高表达也可能具有转移作用,比如膀胱膀胱尿路上皮癌(BLCA)。


再看研究概况

好,有数据依据了,那CCL5别人都研究到什么程度了呢?这时你可以通过工具中的研究热点来看。研究热点根据基因在数据库中的注释情况,从相关文献、通路、功能、已验证的靶向miRNA、和疾病五个角度来统计和评价基因研究情况。

(点开看大图)

 PS : 绿色代表目标基因,灰色代表了数据库中众基因在 各个层面的中位数。

1. 相关文献:被文献报道的总次数;

2. 通路:即根据KEGG数据库统计基因参与的通路的数 量;

3. 功能:即根据Go数据库(Gene Ontology,基因本   体学数据库),统计基因参与的功能(生物过程)的数       量。

4. 已验证的靶向microRNA:已经有文献发表验证的     miRNA的数量。

5. 疾病:已经有文献发表的疾病数量。


从上图绿色包围灰色的形势看,这个CCL5也算研究的热门了。点击相应的内容,可以进入到对应的数据界面。

 

那CCL5都在哪些疾病中研究过了呢?点击“disease”就可以跳转到疾病界面,它统计了基因的研究最多的疾病TOP 20。我们关注CCL5在癌症转移方面的研究,找到“癌症转移”,不算太多,点击即可进入文献详情页面。

(点开看大图)


好用不?下面解决下第二个问题。



2

确定基因后如何快速确定下一步怎么做


现在假设CCL5是可以作为我们后续的研究对象,在基因层面,一般的思路是先做基因的功能验证,再探讨基因的作用机理。前者比较常规,在这不做过多讨论,今天来看看如何用基因雷达快速挖掘出基因可能的调控网络。


画调控网络

在机制探索中,找出关键基因后,会以它为中心展开,看其受到哪些基因调控,又调控了哪些基因,就是所谓的找其上下游基因/调控因子,进而摸索出一整个调控网络。


在基因里雷达中,调控网络整合了文献报道过的TF,miRNA,lncRNA及KEGG数据库中的上下游基因。如CCL5的调控网络,不同色块代表不同的基因层面和作用方式,点击图中的某个点可看到具体的数据信息。

(点开看大图)

ps:

1. 转录因子:已经有文献报道的相关转录因子;

2. miRNA:已经有文献报道的相关miRNA;

3. lncRNA:依据文献挖掘可能有关的lncRNA;(准确性较弱)

4. 上下游相关基因:依据KEGG数据库的基因上下游关系。


图很炫,但结果这么多,咋理出一条线来呢?这个的话就需要结合具体的研究场景去做筛选了。

 

如果想找新的被人没做过的转录因子,可在基因雷达中的预测转录一因子部分查看。还是CCL5为例,CCL5预测到的TF只有三个,这样

(点开看大图)

Ps:基于基因的转录本通过Transfac数据库进行转录因子预测,以推荐度来表示预测出来的转录因子的科研价值,推荐度越高越好。


用完只有一种感觉,专门为我这种四体不勤的人准备的嘛。求链接!




福利

【留言说说为什么想要和对课题思路的想法】

点赞数超过5的送基因雷达1个月体验券。

2017年8月25号18点截止哦


想了解更多基因雷达信息,点这里!