专栏名称: 生信杂谈
生物信息学;生物信息;计算机辅助药物设计;测序分析;Python;R;机器学习;论文写作;网站制作;LOL;dota2。
目录
相关文章推荐
微观三农  ·  她们的童年,起点就是复兴号! ·  3 天前  
微观三农  ·  吴宏耀:巩固和完善农村基本经营制度 ·  6 天前  
51好读  ›  专栏  ›  生信杂谈

gtf格式的基因组注释文件转bed12格式.

生信杂谈  · 公众号  ·  · 2017-07-01 23:30

正文

前面介绍了gtfbed6格式的脚本(点我查看).但bed6格式的注释文件包含信息有限,没有包含基因结构信息.下面介绍个来自RSeQC的能够将gtf格式的注释文件转为能保留转录本信息的bed12格式的文件.

  关于bed12格式的详细说明链接:  https://genome.ucsc.edu/FAQ/FAQformat.html#format1

  这个将gtf转为bed12的脚本名为gtf2bed,源码都在github上,链接如下:  https://github.com/ExpressionAnalysis/ea-utils/tree/master/clipper

  或者也可以通过网盘直接下载:  https://pan.baidu.com/s/1pLt1VPh .

  使用方法很简单,就两个参数,一个是待转换的gtf文件,一个是输出文件名,拿hg19lncRNA的注释文件gencode.v19.long_noncoding_RNAs.gtf举例:

./gtf2bed gencode.v19.long_noncoding_RNAs.gtf >gencode.v19.long_noncoding_RNAs.bed

  转玩后将gtfbed格式的文件放到IGV里就可以查看lncRNA的转录本信息:

  上图中上面的红框是基因(gtf文件),下面的红框是每个基因所对应的转录本(bed12文件).

更多原创精彩视频敬请关注生信杂谈: