专栏名称: 生信石头
记录和分享生信学习经验和数据处理技巧
目录
相关文章推荐
51好读  ›  专栏  ›  生信石头

小功能 | 检测你下载的基因组序列和注释是否匹配?

生信石头  · 公众号  ·  · 2025-03-03 08:41

正文

许多物种的基因组已经被测定,当我们使用这些数据进行下游分析的时候,一般我们会需要至少两个文件:

  1. 基因组序列文件,Fasta 格式;
  2. 基因结构注释信息,GFF3或GTF格式。

这两个文件几乎贯穿了所有生物信息学数据分析工作。

不时会看到,一些 TBtools 用户因为没有正确下载到匹配的两个文件(可能是下载错文件,也可能是其他原因),导致没有得到运行结果。因此而浪费许多时间。

为此,我简单实现了一个「GXF Genome Match Test」功能。用户可以简单输入两个文件,TBtools会快速做简单的判断。总的来说,我觉得检测还是很准确的,我写了几个规则。主要是基于ID匹配。

详细如下







请到「今天看啥」查看全文