一 简介
PGDSpider 是一款强大的数据格式转换工具,其可以自动转换多种群体遗传学或者基因组学软件所需的数据格式,且支持多种数据类型 (如DNA, RNA, SSR, AFLP, RFLP, SNPs, Allele frequence 等)。
PGDSpider 可以以多种数据格式做为输入文件,包括 VCF 格式! 很多软件声称可以处理 VCF,但是真正用的时候,总会遇到各种问题。使用 PGDSpider, 将会从此摆脱这种烦恼!
PGDSpider 可在各种常见数据格式之间进行转换,如下图:
二 下载安装
PGDSpider 是 Java 编译的软件,可在各个平台上安装使用 (Windows, Mac, Linux),其安装过程非常简单:
1 安装 Java。
2 下载最新版的软件(http://cmpg.unibe.ch/software/PGDSpider/)
三 使用方法
PGDSpider 是图形界面的软件,鼠标点击即可完成格式转换 (在定义好SPID 文件以后,其也可以用命令行执行)。下面来看一下具体的使用方法 (以从 VCF 格式转换为 Arlequin 格式为例):
打开软件,Windows 可以直接双击 PGDSpider2.exe; Linux 从终端运行 ./PGDSpider2.sh; Mac 从终端运行 java -Xmx1024m -Xms512M -jar PGDSpider2.jar:
定义输入文件和输出文件格式,并选择输入文件,定义输出文件路径及名称。
点击 Create/Edit SPID file,定义 SPID 文件:
在这里可以定义物种的倍性,也可以对 VCF 文件进行一些过滤 (由于计算用的 VCF 一般都是做过过滤的,这里可以不再对可选项进行操作),最重要的是定义个体的群体信息。这个群体信息文件有 2 列,第一列是 VCF 文件内相应的个体名称,第二列是个体所对应的群体名称。完成这些操作后,点击 Save and Apply,定义 SPID 文件的名称和存储路径后保存即可。
点击 Convert 运行软件,待软件提示 translation completed 后即可得到相应的转换文件。
注意事项: