专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
生物探索  ·  Cell | ... ·  2 天前  
生物制品圈  ·  疾病控制率达100%!明济生物癌症1类新药拟 ... ·  3 天前  
生信宝典  ·  Nature | ... ·  2 天前  
生信菜鸟团  ·  期刊泛读 | Cell 出版社 | 优质期刊 ·  3 天前  
51好读  ›  专栏  ›  生信菜鸟团

生信小工具之:Bedtk

生信菜鸟团  · 公众号  · 生物  · 2021-01-20 21:35

正文

这次推文继续和大家分享近期一些实用的生信小工具。今天给大家带来的是Heng Li大神,最新写的一款小工具Bedtk。

工具介绍

Bedtk是一组用于处理BED文件的简单工具。到目前为止,它可以用于实现intersection, subtraction, sorting, merging and computing the coverage等一系列的功能。简单来说Bedtk就是一款精简版的bedtools。但是相对于bedtools,它更专注于性能。相比之下Bedtk的速度要快几到几十倍,并且占用的内存很少。它还提供了一些方便的功能。例如,sorting, merging and intersection,可以在没有Unix管道的情况下一次性完成。

工具下载和安装

下载安装一气呵成:

  1. git clone https://github.com/lh3/bedtk

  2. cd bedtk && make

查看使用手册:

  1. ./bedtk


  2. Usage: bedtk

  3. Command:

  4. isec intersection (bedtools intersect)

  5. flt filter BED/VCF file (bedtools intersect/window)

  6. cov breadth of coverage (bedtools coverage)

  7. sub subtraction (bedtools subtract)

  8. merge merge overlapping regions (bedtools merge)

  9. sort sort regions (bedtools sort)

  10. sum total region length

  11. version version number

具体使用例子

bedtk flt

bedtk flt可用于过滤bed文件和vcf文件。比如根据注释的bed文件,过滤现有的bed文件:

  1. ./bedtk flt test/test-anno.bed.gz test/test-iso.bed.gz

当然也可以反过来找不重合的部分:

  1. ./bedtk flt -v test/test-anno.bed.gz test/test-iso.bed.gz

也可以根据滑动窗口来找目标重合的区域:

  1. ./bedtk flt -cw100 test/test-anno.bed.gz test/test-sub.vcf.gz

bedtk intersect

bedtk intersect 和bedtools intersect功能一样,找bed文件之间的重合部分。这里大神做了一些优化,不需要sorting,允许有overlapping records。

  1. ./bedtk isec test/test-anno.bed.gz test/test-iso.bed.gz

bedtk cov

bedtk cov用于计算bed文件的覆盖度。

  1. .







请到「今天看啥」查看全文