二代测序的读长比较短,而mRNA长度较长,短read需要经过计算来重建全长mRNA,进而定量基因表达或发现新的可变剪接。本文将评估12种依赖参考基因组的方法(Augustus, Cufflinks, Exonerate, GSTRUCT, iReckon, mGene, mTim,NextGeneid, SLIDE, Transomics, Trembly, Tromer)和两种不依赖参考基因组的从头重建方法(Oases, Velvet)。由于模式或参数的不同,这14种方法具体分为25种不同的protocols。
外显子核酸序列的鉴定
(敏感性:有多少比例的已知外显子核酸序列被重建,精确度:有多少比例的重建RNA核酸序列属于已知外显子。)Augustus, mGene和Transomics在线虫中有很高的敏感性,但精确度一般;在人和果蝇中,它们的表现则有明显的下降。SLIDE 在三个物种中都有优异的表现。Tromer和iReckon虽有很高的敏感性,但精确度不高。对人而言,Augustus, Exonerate, GSTRUCT, NextGeneid, Trembly和Velvet的敏感性与精确度都高于0.6。
外显子个数的鉴定
大多数protocols在人中的精确度要低于其他两个物种,iReckon和SLIDE在线虫和果蝇中整体表现突出。
测序深度和内含子长度的影响
Augustus, mGene和Transomics可以在极低丰度或测序深度时较好的鉴定出外显子,而其他protocols则有最低测序深度的限制。大多数protocols的敏感性与测序深度有简单的线性关系,直到平台期;Tromer是个例外;Oases与Velvet在较高测序深度时,效果也会下降。
Augustus, mGene和Transomics有最高的内含子发现率。内含子的发现率会随着其长度的增加而降低,Tromer又是个例外。
鉴定出的内含子与已知内含子的比较
大多数protocols能较好的鉴定出已知内含子;mGene, Transomics, Tromer, Velvet和Augustus会鉴定出大量的新junctions。
Isoforms拼接能力的比较
外显子缺失是所有protocols共有的缺陷,在线虫中平均30%,而在人中可高达60%。Trembly在人中拼接出了数量最多的完整的isoforms。Augustus, mGene和Transomics则鉴定出了最多数量的isoforms。
Assessment of transcript reconstruction methods for RNA-seq. Nature methods. 2013;10(12)