今天,亲爱的师妹很烦恼,实验室测序了一个样品,公司发回来一个列表,上面是一堆microRAN,老板希望知道这些microRAN已经被验证过的功能,然后可怜的师妹就开始在pubmed里搜文献,最后发现每一个microRNA都有好几页的靶基因,顿时崩溃了。。。。
师妹不懂啥R语言,怎么教他个简(tou)单(lan)的方法完成老板的任务呢?!
首先我们要知道:miRNA是非编码的,所以要知道其功能,需要先知道其靶基因,而目前靶基因有2种来源,一类是通过实验做出来的,可以从
miRTarBase和TarBase
获得,这类数据库是通过整理发表文献而来,假阳性低但有实验偏好的差异。另一类是通过算法预测的,这样的数据库和算法有很多,比如
TargetScan, miranda, PicTar
等等,但毕竟是通过特点预测的,假阳性率就非常高。所以有人建议整合多个靶基因预测数据库会显著降低假阳性率,整合数据库如
mirDIP
等。
在通过以上方法获得靶基因后,就可以用之前我们提到的很多方法,经典的是
寻找差异分子案例实践——富集分析上(七)
寻找差异分子案例实践——富集分析下(八)
把靶基因富集到相应的功能通路上,那些通路上有越多的基因在上面,越说明这个样品有可能是在这条通路上起作用,并具有该功能!
师妹实在不想查文献,那就用
miRTarBase和TarBase
吧,两者都直接整合了文献已经证明的靶基因(包括qPCR、Western blot、Reporter assay等方法)。
以miRTarBase做个简单介绍,
miRTaebase是台湾同胞搞的一个专门收集有实验证据支持microRNA及其靶基因间关系的数据库。目前更新到
2015年9月
。
靶基因可以根据实际需求多种方式进行检索:
1.以microRNA名字,人性化的是可以以
miRNA Family的形式,你懂得,像Let7,真TMD有的太多了。
2.基因反查
3.信号通路
4.被验证的方式
5.根据疾病
6.根据文献
结果页面显示验证的方式和文献篇数,点击即达。
所以,以后就别再傻傻查文献去找micrRNA的靶基因了哈(或者偷个懒只查
2015年9月之后的哈
)。