专栏名称: VG生信软件
国内首家从事Windows平台、可视化生物信息学桌面软件开发的公司。致力于提供领先的生物信息学软件产品和系统服务。产品和业务包括:微生物多样性分析软件、转录组分析软件、重测序分析软件、细菌基因组分析系统。
目录
相关文章推荐
六神磊磊读金庸  ·  来看看你们的螃蟹怎么样了 ·  3 天前  
六神磊磊读金庸  ·  这些年摆烂没能做成的事 ·  6 天前  
历史地理研究资讯  ·  华东师大唐小兵教授:史学论文写作中的文字问题 ·  1 周前  
51好读  ›  专栏  ›  VG生信软件

生信学者需要知道的100个数据库|NAR

VG生信软件  · 公众号  ·  · 2017-09-30 14:29

正文

16年底,Nucleic Acids Research ( NAR ) 上共收录152篇与数据库相关的文章,其中,有54个数据库是之前没有新开发出来的,98个数据库进行升级,还有16篇处于待发表状态,这些数据库涵盖基因组结构、基因表达及其调控、蛋白质、蛋白质结构域和蛋白质-蛋白质相互作用等。近年来,数据库的一个趋势倾向于处理人类健康从癌症突变到药物和药物靶标,由此也可以看出来,已开始从科研层面向应用层面转变,越来越贴近人们健康。同时,NAR评审员和编辑选定三个数据库作为“突破性贡献”,它们主要是涵盖人类从头基因变型,模式生物中的疾病相关表型和用于治疗靶标识别和验证的生物信息学平台,预计这些数据库将会吸引更多的遗传学和基因组学领域工作的研究人员的关注。


以下是最新发表的50多个数据库的链接地址及功能描述。

Database nameBrief descriptionaURL
3DSNPHuman noncoding SNPs: interactions with genes and other SNPs    http://biotech.bmi.ac.cn/3dsnp/
AAgAtlasHuman AutoAntigen database          http://aagatlas.ncpsb.org
ADPriboDBADP-ribosylated proteins and sites         http://adpribodb.leunglab.org/
antiSMASHantibiotics and Secondary Metabolite Analysis SHell       http://antismash-db.secondarymetabolites.org
AraPhenoPhenotypic data for Arabidopsis thaliana        https://arapheno.1001genomes.org
ccNETCo-expression networks for diploid and polyploid Gossypium      http://structuralbiology.cau.edu.cn/gossypium/
CeNDRC. elegans Natural Diversity Resource        http://www.elegansvariation.org
CGDBCircadian Gene database          http://cgdb.biocuckoo.org/
CistromeDBChIP-Seq and DNase-Seq data in human and mouse     http://cistrome.org/db
CoexpediaGene co-expression data mapped to medical subject headings (MeSH).    http://www.coexpedia.org
dbSAPSingle Amino acid Polymorphisms: SNP-derived variation in human proteins    http://www.megabionet.org/dbSAP
denovo-dbHuman de novo gene variants detected by parent-child sequencing    http://denovo-db.gs.washington.edu
DrugCentralActive ingredients of approved pharmaceutical products, indications and mode of action  http://drugcentral.org
EURISCOEuropean catalogue for plant genetic resources       http://eurisco.ecpgr.org/
ExAC browserExome Aggregation Consortium sequence data        http://exac.broadinstitute.org
Exposome-ExplorerBiomarkers of exposure to disease risk factors      http://exposome-explorer.iarc.fr
FAIRDOMHubFindable, Accessible, Interoperable and Reusable Data, Operating procedures and Models   https://fairdomhub.org/
FuzDBDatabase of fuzzy protein complexes        http://protdyn-database.org
GenomeCRISPRHigh-throughput screening using the CRISPR/Cas-9 system       http://genomecrispr.org
GTRDGene Transcription Regulation Database         http://gtrd.biouml.org
HieranoiDBOrtholog groups and trees inferred by Hieranoid2 software     http://hieranoidb.sbc.su.se/
IGSRInternational Genome Sample Resource         http://www.1000genomes.org/data-portal
IMG/VRDOE Joint Genome Institute Viral Resource       https://img.jgi.doe.gov/vr/
JET2 Viewerviewer/ Joint Evolutionary Trees: protein-protein interaction patches in known structures   http://www.lcqb.upmc.fr/jet2
jPOSTrepoJapanese ProteOme STandard repository         https://repository.jpostdb.org/
KERISKaleidoscope of gEne Responses to Inflammation among Species     http://igenomed.org/KERIS
LinkProtTopologically complex protein structures         http://linkprot.cent.uw.edu.pl/
LNCeditingRNA editing sites in lncRNAs from human, monkey, mouse and fly  http://bioinfo.life.hust.edu.cn/LNCediting/
MEGaResMechanisms of antimicrobial resistance         https://meg.colostate.edu/MEGaRes/
MembranomeA database of single-pass membrane proteins       http://membranome.org/
MethSMRTDNA methylation data from Single Molecule, Real-Time sequencing     http://sysbio.sysu.edu.cn/methsmrt
mirDNMRBackground de novo mutation rates in human genes     https://www.wzgenomics.cn/mirdnmr/
Monarch InitiativeHuman disease-related genotypes and phenotypes in model organisms     http://monarchinitiative.org
MRPrimerVPCR primer pairs for detecting RNA virus-mediated infectious diseases    http://infolab.dgist.ac.kr/MRPrimerV
mutLBSgeneDBMutations in Ligand Binding Sites gene DataBase      http://www.zhaobioinfo.org/mutLBSgeneDB/
NSDNANervous System Disease NcRNA Atlas        http://www.bio-bigdata.net/nsdna/
OntobeeOntology database server of OBO Foundry       http://www.ontobee.org/
Open TargetsTarget validation platform: links between potential drug targets and diseases   https://targetvalidation.org
pathDIPPathway data integration and analysis portal       http://ophid.utoronto.ca/pathDIP
PathoYeastractTranscription regulation in pathogenic yeasts        http://pathoyeastract.org/index.php
PceRBasePlant competing endogenous RNAs         http://bis.zju.edu.cn/pcernadb/index.jsp
PharosData on unstudied and understudied drug targets      https://pharos.nih.gov/idg/index
PLaMoMPlant Mobile Macromolecules: Extracellular siRNAs, microRNAs,  mRNAs and proteins in plants http://www.byanbioinfo.org/plamom/
Plant ReactomePlant metabolic, regulatory and signaling pathways       http://plantreactome.gramene.org/
PMDBasePlant microsatellites and marker development        http://www.sesame-bioinfo.org/PMDBase
POSTARPost-transcriptional regulation by RNA-binding proteins        http://POSTAR.ncrnalab.org
proGenomesConsistently annotated bacterial and archaeal genomes       http://van.embl.de/progene/
Proteome-pIPre-computed isoelectric points for >5000 proteomes       http://isoelectricpointdb.org/
REDIportalA-to-I RNA editing events in human       http://srv00.recas.ba.infn.it/atlas/
RNALocateRNA localization in the cell        http://www.rna-society.org/rnalocate/
SNP2TFBSRegulatory SNPs affecting predicted transcription factor binding sites     http://ccg.vital-it.ch/snp2tfbs/:
SoyNetCo-functional networks for soy bean Glycine max      http://www.inetbio.org/soynet/
TFBSbankTranscription Factor Binding Site profiles deduced from ChIP-seq or ChIP-chip data  http://tfbsbank.co.uk/
TSTMPTarget Selection database for human TransMembrane Proteins      http://tstmp.enzim.ttk.mta.hu
UniclustClustered protein sequences and multiple sequence alignments      http://uniclust.mmseqs.com/
WERAMWriters, Erasers and Readers of histone Acetylation and Methylation    http://weram.biocuckoo.org/

注:可能有些网站失效


下面是回顾汇总12年来全社会广泛使用的具有权威性,全面性和便利性的数据库。小编觉得数据库不仅可以提高个人知名度和权威性,还可以推动加速科研产出造福人类。

Database nameCurrent URLBrief description
Annual updates
DDBJhttp://www.ddbj.nig.ac.jpAll known nucleotide and protein sequences
ENAhttp://www.ebi.ac.uk/enaAll known nucleotide and protein sequences
GenBankhttps://www.ncbi.nlm.nih.gov/genbank/All known nucleotide and protein sequences
Ensemblhttp://www.ensembl.org/Annotated information on eukaryotic genomes
Mouse Genome Databasehttp://www.informatics.jax.orgMouse genome database
UCSC Genome Browserhttp://genome.ucsc.edu/A universal genome viewing and analysis platform
UniProthttp://www.uniprot.orgA universal database of protein sequences (includes Swiss-Prot and TrEMBL)
Regular updates
ArrayExpresshttp://www.ebi.ac.uk/arrayexpressArray-based gene expression data
BioCycdhttp://biocyc.org/Pathway information for sequenced
BioGRIDhttp://www.thebiogrid.orgGenetic and physical interactions in yeast, worm and fly
BRENDAhttp://www.brenda-enzymes.infoEnzyme names and biochemical properties
CGDhttp://www.candidagenome.org/Candida Genome Database
CanSARhttp://cansar.icr.ac.ukCancer research and drug discovery resource
CATHhttp://www.cathdb.infoProtein domain structure database
CAZyhttp://www.cazy.orgCarbohydrate-Active enZymes database
CDDhttp://www.ncbi.nlm.nih.gov/cddConserved Domain Database
ChEBIhttp://www.ebi.ac.uk/chebiChemical Entities of Biological Interest
ChEMBLhttps://www.ebi.ac.uk/chembldbInteraction of drugs and compounds with their targets
ChimerDBhttp://ercsb.ewha.ac.kr/fusiongeneChromosome translocations and gene fusions
COGhttp://www.ncbi.nlm.nih.gov/COGClusters of Orthologous Groups of proteins
Comparative Toxicogenomics Databasehttp://ctdbase.orgA knowledgebase for curated chemical-gene-disease networks
COSMIChttp://cancer.sanger.ac.ukCatalogue of Somatic Mutations in Cancer
CyanoBasehttp://genome.microbedb.jp/cyanobaseCyanobacterial genomes
dbPTMhttp://dbPTM.mbc.nctu.edu.tw/Post-translational modification of proteins
DBTSShttp://dbtss.hgc.jp/Database of transcriptional start sites
DEGhttp://www.essentialgene.orgDatabase of essential genes
DictyBasehttp://dictybase.orgModel organism database for Dictyostelium discoideum
DrugBankhttp://www.drugbank.ca/Drug and drug target database
EcoCychttp://ecocyc.org/E. coli K12 genes, metabolic pathways, transporters, and gene regulation
eggNOGhttp://eggnog.embl.de/Evolutionary genealogy of genes:Non-supervised Orthologous Groups
ELMhttp://elm.eu.org/Eukaryotic Linear Motif: functional sites in eukaryotic proteins
EMAGEhttp://www.emouseatlas.org/emage/e-Mouse Atlas of Gene Expression
ENCODE project at UCSChttp://genome.ucsc.edu/ENCODEEncyclopedia of DNA Elements,functional elements in human genome
EPDhttp://epd.vital-it.chEukaryotic Promoter Database
EuPathDhttp://eupathdb.org/Unified genome databases on eukaryotic pathogens (includes PlasmoDB, ToxoDB, ApiDB,TrichDB, TriTrypDB, GiardiaDB,etc.)
Expression Atlashttp://www.ebi.ac.uk/gxa/Dene expression patterns deduced from microarray and RNA-seq data
FANTOMhttp://fantom.gsc.riken.jp/Functional annotation of mouse full-length cDNA clones
FINDBasehttp://www.findbase.orgFrequencies of INherited Disorders
FlyBasehttp://flybase.org/Drosophila sequences and genomic information
FlyRNAihttp://flyrnai.org/Genome-wide RNAi analysis in Drosophila
Gene3Dhttp://gene3d.biochem.ucl.ac.ukStructural domain assignments for protein sequences
Genenameshttp://www.genenames.org/The HGNC human gene nomenclature database
GenomeRNAihttp://www.genomernai.orgRNA interference data for human and Drosophila
GEOhttp://www.ncbi.nlm.nih.gov/geo/NCBI’s Gene Expression Omnibus
GOhttp://www.geneontology.orgGene Ontology Database
GOAhttp://www.ebi.ac.uk/GOAGene Ontology annotations for proteins in UniProt
GOLDhttps://gold.jgi.doe.gov/Genomes online database: completed and ongoing genome projects
GPCRdbhttp://gpcrdb.org/Data and tools for studying G protein-coupled receptors
Gramenehttp://www.gramene.orgComparative genomics of crops and model plant species
GXDhttp://www.informatics.jax.org/expression.shtmlMouse Gene Expression Database
HAMAPhttp://hamap.expasy.org/High-quality Automated and Manual Annotation of Proteins
HMDBhttp://www.hmdb.caHuman Metabolome Database
IEDBhttp://www.iedb.org/Immune Epitope Database
IMG/Mhttp://img.jgi.doe.gov/mJGI’s Integrated Microbial Genomics and Metagenomics
IMGThttp://www.imgt.orgInternational ImMunoGeneTics database.
InParanoidhttp://InParanoid.sbc.su.seOrthologous relationships between eukaryotic proteomes
IntActhttp://www.ebi.ac.uk/intact/Protein–Protein INTerACTion data
InterProhttp://www.ebi.ac.uk/interproIntegrated resource of protein families, domains and functional sites
IPDhttp://www.ebi.ac.uk/ipdImmuno Polymorphism database (includes IMGT/HLA)
JASPARhttp://jaspar.genereg.net/PSSMs for transcription factor DNA-binding sites
KEGGhttp://www.genome.ad.jp/keggKyoto Encyclopedia of Genes and Genomes: genes, proteins, pathways
MEROPShttp://merops.sanger.ac.uk/Database of proteases (peptidases)
MetaCychttp://metacyc.org/Metabolic pathways and enzymes in various organisms
miRBasehttp://www.mirbase.org/MicroRNA sequences, names and predicted targets in animals
miRGatorhttp://mirgator.kobic.re.krMicroRNA expression profiles and mRNA targets
miRGenhttp://www.microrna.gr/mirgenMicroRNA promoters and transcription start sites
miRTarBasehttp://miRTarBase.mbc.nctu.edu.tw/Experimentally validated microRNA–target interactions
MMDBhttp://www.ncbi.nlm.nih.gov/StructureMolecular Modeling Database of protein structures
MODOMICShttp://genesilico.pl/modomics/RNA modification pathways
Mouse Tumor Biology Databasehttp://tumor.informatics.jax.org/mtbwi/Mouse as a model system of human cancers
neXtProthttps://www.nextprot.org/A database of human proteins
NONCODEhttp://noncode.org/A database of noncoding RNAs
OMIMhttp://www.omim.orgOnline Mendelian inheritance in man: A catalog of human genetic and genomic disorders
OrthoDBhttp://www.orthodb.orgAn hierarchical catalog of orthologous proteins
PANTHERhttp://www.pantherdb.orgProtein sequence evolution mapped to functions and pathways
PATRIChttp://www.patricbrc.orgPathoSystems Resource Integration Center
PDBhttp://rcsb.org/pdbProtein DataBank: All biological macromolecular structures
PDBehttp://www.ebi.ac.uk/pdbe/Protein Databank in Europe
PDBsumhttp://www.ebi.ac.uk/pdbsumSummaries and analyses of PDB structures
Pfamhttp://pfam.xfam.orgProtein families: Multiple sequence alignments and profile hidden Markov models of protein domains
PHI-basehttp://www4.rothamsted.bbsrc.ac.uk/phibase/Genes affecting fungal pathogen–host interactions
PIRhttp://pir.georgetown.edu/Protein Information Resource, part of UniProt
PRIDEhttp://www.ebi.ac.uk/pride/Proteomics peptide identification database
PRINTShttp://www.bioinf.man.ac.uk/dbbrowser/PRINTSProtein fingerprints, conserved motifs used to characterise a protein family
Prositehttp://www.expasy.org/prositeBiologically-significant protein patterns and profiles
PubChemhttp://pubchem.ncbi.nlm.nih.gov/Structures and biological activities of small organic molecules
RGDhttp://rgd.mcw.edu/Rat Genome Database
RDPhttp://rdp.cme.msu.eduRibosomal Database Project:Bacterial and archaeal 16S rRNA and fungal 28S rRNA sequences
Reactomehttp://www.reactome.orgA database of metabolic and signaling pathways
REBASEhttp://rebase.neb.com/rebase/Restriction enzyme database
RefSeqhttps://www.ncbi.nlm.nih.gov/refseq/NCBI Reference Sequence Database
Rfamhttp://rfam.xfam.orgRNA families with multiple sequence alignments
SCOPhttp://scop.mrc-lmb.cam.ac.uk/Structural Classification Of Proteins
SGDhttp://www.yeastgenome.orgSaccharomyces Genome Database
SILVAhttp://www.arb-silva.de/Aligned small- and large subunit rRNA sequences
SIMAPhttp://mips.gsf.de/simap/Similarity Matrix of Proteins
SMARThttp://smart.embl-heidelberg.deSimple Modular Architecture Research Tool: signalling,extracellular and chromatin-associated protein domains
STITCHhttp://stitch-db.org/Search Tool for Interactions of Chemicals
STRINGhttp://string.embl.de/Predicted functional associations between proteins
SUPERFAMILYhttp://supfam.orgGenome-wide identification of protein domains of known structure
SWISS-MODELhttp://swissmodel.expasy.org/3D models for proteins of unknown structure
TAIRhttp://www.arabidopsis.org/The Arabidopsis information resource
TarBasehttp://microrna.gr/tarbaseDatabase of experimentally supported microRNA targets
TCDBhttp://www.tcdb.org/Transporter protein classification database
UCSC Cancer Genomics Browserhttps://genome-cancer.ucsc.edu/Visualization of cancer genomic datasets
VectorBasehttps://www.vectorbase.org/Invertebrate vectors of human pathogens
WormBasehttp://www.wormbase.orgCommunity portal on all aspects of C. elegans biology
XenBasehttp://www.xenbase.orgXenopus frog database
YEASTRACThttp://www.yeastract.comTranscriptional regulation in Saccharomyces cerevisiae
ZFINhttp://zfin.org/Zebrafish information network


参考文献

1.Galperin M Y, Fernándezsuárez X M, Rigden D J. The 24th annual Nucleic Acids Research database issue: a look back and upcoming changes[J]. Nucleic Acids Research, 2017, 45(Database issue):D1-D11.