专栏名称: 生物极客

北京合生基因科技有限公司（Beijing Syngentech Co., LTD.）是一家专注于合成生物学在科研和医药健康领域应用的生物技术公司。合生基因致力于为全球生命科学研究者提供世界一流的个性化合成生物学技术服务与科研产品。

三分钟了解一个数据库助力科研|突变数据库-原核基因组数据库-人类进化数据库

生物极客 · 公众号 · 生物 · 2017-11-08 23:59

正文

前言：

正所谓魔刀不为砍柴工，很多生信的数据库网站有着非常友好的界面，非常全面的整理，及时的更新，这些数据库为我们了解很多信息，提供了全新的帮助。及时的使用这些数据库，不仅仅可以促进我们更好的科研，而且帮助我们掌握全局的思想大有裨益。

沿着上期的思路

小众但对科研帮助非常大的数据库--引物、结构域、功能

今天我们继续来关注一些有用的数据库，从中获得一些帮助我们很大的信息。

数据库一：Refseq

地址：

https://www.ncbi.nlm.nih.gov/refseq/

国家生物技术信息中心 (NCBI) 的参考序列 (RefSeq) 项目为超过 95 000 原核基因组提供了注释。这些基因组由single Prokaryotic Genome Annotation Pipeline进行注释，拥有良好的一致性和准确性。

最近多项重要更新被添加进来。包括抗菌蛋白进行了重新注释，改进了transpoases（转座）相关的注释，同时对于多domain的蛋白进行了注释。升级了相应的注释规则。

使用演示：

可以逐个观察相应的基因组的注释：

数据库二：

VarCards（http://varcards.biols.ac.cn/）

越来越多的基因组工具和数据库被开发出来来解释相应的基因组突变，特别是在编码区域中，数据库比较多。然而，这些工具分别在不同的在线网站或数据库中可用，使得一般临床医师，遗传学家和生物学家难以获得关于某些特定变体和感兴趣基因的第一手信息。从编码区域和剪接位置开始，来自我国的科学家近期报道了新的数据库，名为VarCards。人工产生所有可能的单核苷酸变体（n = 110 154 363）并编目所有报道的插入和缺失（n = 1 223 370）。然后，我们对来自60多个基因组数据源的功能性后果的这些变体进行注释，以开发一个名为的数据库，用户可以方便地搜索，浏览和注释给定变体的变异和基因水平含义。

数据库三：PGG.Population

https://www.pggpopulation.org

随着百万人基因组测序数据的逐步更新，我们越来越可以回答，我们祖先是谁？

曹操是不是我们亲戚？

要回答这样的问题，就需要族谱DNA数据库。

越来越多的研究侧重于描述基于新一代测序技术解析的与复杂的人类特征和疾病相关的遗传变异。然而，确定疾病相关因果变体，并确定优先顺序，依赖于了解人群内部和群体之间遗传变异的分布。 PGG.Population数据库记录来自107个国家的代表356个全球人口的7122个基因组，为研究人员了解人类基因组多样性和遗传祖先提供重要信息。