专栏名称: VG生信软件
国内首家从事Windows平台、可视化生物信息学桌面软件开发的公司。致力于提供领先的生物信息学软件产品和系统服务。产品和业务包括:微生物多样性分析软件、转录组分析软件、重测序分析软件、细菌基因组分析系统。
目录
相关文章推荐
爱猫之和高Y家打官S版  ·  我寻思着铲屎官能有多宠溺猫咪,看完后震惊:这 ... ·  2 天前  
爱猫之和高Y家打官S版  ·  我寻思着铲屎官能有多宠溺猫咪,看完后震惊:这 ... ·  2 天前  
掌上平度  ·  平度“萌宠经济”火热升温! ·  3 天前  
掌上平度  ·  平度“萌宠经济”火热升温! ·  3 天前  
广州普法  ·  一天跑9家,男子直呼:比上班赚多了! ·  3 天前  
植物星球  ·  山谷里的铃兰来了,今年还有粉色和重瓣 ·  5 天前  
51好读  ›  专栏  ›  VG生信软件

R txdb创建与读取

VG生信软件  · 公众号  ·  · 2018-04-16 17:30

正文

txdb初识

谈到txdb,不得不提两个包,"GenomicFeatures"和“Txdb.Hsapiens.UCSC.hg38.knownGene”,这两个包都是用来创建Txdb对象。

有的人用的是hg19,这里我采用最新的hg38,操作函数都是一样的,只是所包含的信息更多。



使用R加载两个包

首先把这两个包安装起来,接下来一步步来看Txdb究竟是什么东西。

source("https://bioconductor.org/biocLite.R")
biocLite("GenomicFeatures")
source("https://bioconductor.org/biocLite.R")
biocLite("TxDb.Hsapiens.UCSC.hg38.knownGene")

查看GenomicFeatures所包含的txdb对象,实际上只是下面一个包的子集。
查看所有的信息,我们需要加载第二个包。

library('GenomicFeatures')
samplefile"hg19_knownGene_sample.sqlite", package="GenomicFeatures")
txdb

可以看到其只包含178个转录本,620个外显子,信息是很少的。


接下来要加载hg38全部基因组信息

library(TxDb.Hsapiens.UCSC.hg38.knownGene)

txdb txdb


可以看到无论是外显子,转录本还是编码区都是最多的,因为这是hg38整理好的全部基因组信息。

这里面有几个最常见的函数:

genes(txdb)

exons(txdb)

transcripts(txdb)

cds(txdb)

可以看到genes函数,提取24183个基因信息,

exons(txdb)

而用exons函数可以提取这个txdb对象的exons信息,共289969个exon

transcripts(txdb)

可以提取转录本信息,共197782个转录本

还有cds函数等来提取到cds的信息

这里的图片我就不一一展示了,感兴趣的同学,可以自己试一下,其他函数

注意一点:无论什么函数返回的对象都是一个Granges对象



如何创建txdb对象







请到「今天看啥」查看全文