在之前微生物扩增子分析系列文章中,介绍了微生物物种注释的方法及物种数据库。常用物种注释的数据库有
Greengene
,
Silva
和
Unite
等,下面我们就来一一介绍下!
Greengene数据库(官网:http://greengenes.secondgenome.com/)是针对细菌和古菌16S rRNA基因的数据库,该数据库更新较慢,目前版本为2013年5月更新的gg_13_5版本(下载链接:http://greengenes.secondgenome.com/downloads/database/13_5)。由于是人工整理,比较准确。很多科研工作者依然选择使用该数据库。分类层级采用常用的七级界门纲目科属种,方便理解和阅读。同时,QIIME软件默认物种注释数据库也是它。PICRUST分析工具,即根据16S rRNA高通量测序结果预测微生物群落功能的分析,也是基于Greengne数据库开发的。
Silvia数据库(官网:https://www.arb-silva.de/)是一个包含三域微生物(细菌,古菌,真核)rRNA基因序列的综合数据库。其数据库涵盖了原核和真核微生物的小亚基rRNA基因序列(简称SSU,即16S和18SrRNA)和大亚基rRNA基因序列(简称LSU,即23S和28SrRNA),更新频繁,目前其最新版本为SILVA SSU and SU databases 128(下载链接:https://www.arb-silva.de/no_cache/download/archive/release_128/),更新时间为2016年9月29日。由于是最大最全的数据库,其缺点是假阳性会更高。另一方面,它的物种注释采用的是14层级,且与常用的七级不同,不能转化和比较。现也有在线分析工具—SilvaNGS。
ITS(全称ribosomal internal transcribed spacer,核糖体基因内转录间隔区)是最常用的真菌鉴定及多样性检测的marker基因,Unite数据库(官网:https://unite.ut.ee/)是专门针对真菌ITS序列的数据库。UNITE常作为ITS序列高通量测序后对真菌进行分类注释的比对数据库,目前数据库已经更新到7.2(下载链接:https://unite.ut.ee/repository.php),更新时间为2017年6月8日。