专栏名称: 生信百科
依托高校科研平台,面向生物信息科研工作者。生物信息学习资料;常见数据分析技巧、流程;公共数据库分享;科研思路分享;
目录
相关文章推荐
蒲公英Ouryao  ·  FDA审评:Capivasertib片的处方 ... ·  6 天前  
51好读  ›  专栏  ›  生信百科

基于RNA-seq的转录本重建方法的评估

生信百科  · 公众号  · 医学  · 2017-07-10 08:00

正文

二代测序的读长比较短,而mRNA长度较长,短read需要经过计算来重建全长mRNA,进而定量基因表达或发现新的可变剪接。本文将评估12种依赖参考基因组的方法(Augustus, Cufflinks, Exonerate, GSTRUCT, iReckon, mGene, mTim,NextGeneid, SLIDE, Transomics, Trembly Tromer)和两种不依赖参考基因组的从头重建方法(Oases Velvet)。由于模式或参数的不同,这14种方法具体分为25种不同的protocols

 

外显子核酸序列的鉴定

(敏感性:有多少比例的已知外显子核酸序列被重建,精确度:有多少比例的重建RNA核酸序列属于已知外显子。)Augustus, mGeneTransomics在线虫中有很高的敏感性,但精确度一般;在人和果蝇中,它们的表现则有明显的下降。SLIDE 在三个物种中都有优异的表现。TromeriReckon虽有很高的敏感性,但精确度不高。对人而言,Augustus, Exonerate, GSTRUCT, NextGeneid, TremblyVelvet的敏感性与精确度都高于0.6

 

外显子个数的鉴定

大多数protocols在人中的精确度要低于其他两个物种,iReckonSLIDE在线虫和果蝇中整体表现突出。

 

测序深度和内含子长度的影响

Augustus, mGeneTransomics可以在极低丰度或测序深度时较好的鉴定出外显子,而其他protocols则有最低测序深度的限制。大多数protocols的敏感性与测序深度有简单的线性关系,直到平台期;Tromer是个例外;OasesVelvet在较高测序深度时,效果也会下降。

 

Augustus, mGeneTransomics有最高的内含子发现率。内含子的发现率会随着其长度的增加而降低,Tromer又是个例外。

 

鉴定出的内含子与已知内含子的比较

大多数protocols能较好的鉴定出已知内含子;mGene, Transomics, Tromer, VelvetAugustus会鉴定出大量的新junctions


 Isoforms拼接能力的比较

外显子缺失是所有protocols共有的缺陷,在线虫中平均30%,而在人中可高达60%Trembly在人中拼接出了数量最多的完整的isoformsAugustus, mGeneTransomics则鉴定出了最多数量的isoforms

Assessment of transcript reconstruction methods for RNA-seq. Nature methods. 2013;10(12)