专栏名称: 生信圈
关注生物医学大数据、以及数据分析方法在转化医学研究中的应用进展,讨论与生物信息相关的一切话题。
目录
相关文章推荐
人生研究所  ·  “偷看早恋女儿聊天记录,我彻底崩溃……” ·  13 小时前  
人生研究所  ·  全套34册3D立体书,带孩子一次游遍全中国 ·  13 小时前  
财联社AI daily  ·  华为Pura X“阔”在哪里?一文详解! ·  昨天  
财联社AI daily  ·  华为Pura X“阔”在哪里?一文详解! ·  昨天  
学习曾国藩  ·  熟人之间,明白这4个人性,没人能拿捏你! ·  3 天前  
51好读  ›  专栏  ›  生信圈

就在这里,等你来用——微生物扩增子常用数据库

生信圈  · 公众号  ·  · 2017-12-28 21:00

正文

在之前微生物扩增子分析系列文章中,介绍了微生物物种注释的方法及物种数据库。常用物种注释的数据库有 Greengene Silva Unite 等,下面我们就来一一介绍下!


1 Greengene 数据库


Greengene数据库(官网:http://greengenes.secondgenome.com/)是针对细菌和古菌16S rRNA基因的数据库,该数据库更新较慢,目前版本为2013年5月更新的gg_13_5版本(下载链接:http://greengenes.secondgenome.com/downloads/database/13_5)。由于是人工整理,比较准确。很多科研工作者依然选择使用该数据库。分类层级采用常用的七级界门纲目科属种,方便理解和阅读。同时,QIIME软件默认物种注释数据库也是它。PICRUST分析工具,即根据16S rRNA高通量测序结果预测微生物群落功能的分析,也是基于Greengne数据库开发的。

2 Silvia 数据库


Silvia数据库(官网:https://www.arb-silva.de/)是一个包含三域微生物(细菌,古菌,真核)rRNA基因序列的综合数据库。其数据库涵盖了原核和真核微生物的小亚基rRNA基因序列(简称SSU,即16S和18SrRNA)和大亚基rRNA基因序列(简称LSU,即23S和28SrRNA),更新频繁,目前其最新版本为SILVA SSU and SU databases 128(下载链接:https://www.arb-silva.de/no_cache/download/archive/release_128/),更新时间为2016年9月29日。由于是最大最全的数据库,其缺点是假阳性会更高。另一方面,它的物种注释采用的是14层级,且与常用的七级不同,不能转化和比较。现也有在线分析工具—SilvaNGS。

3 Unite 数据库


ITS(全称ribosomal internal transcribed spacer,核糖体基因内转录间隔区)是最常用的真菌鉴定及多样性检测的marker基因,Unite数据库(官网:https://unite.ut.ee/)是专门针对真菌ITS序列的数据库。UNITE常作为ITS序列高通量测序后对真菌进行分类注释的比对数据库,目前数据库已经更新到7.2(下载链接:https://unite.ut.ee/repository.php),更新时间为2017年6月8日。

Greengene







请到「今天看啥」查看全文