专栏名称: 生信百科
依托高校科研平台,面向生物信息科研工作者。生物信息学习资料;常见数据分析技巧、流程;公共数据库分享;科研思路分享;
51好读  ›  专栏  ›  生信百科

数据格式转换神器——PGDSpider

生信百科  · 公众号  · 医学  · 2017-10-19 03:09

正文

一 简介

PGDSpider 是一款强大的数据格式转换工具,其可以自动转换多种群体遗传学或者基因组学软件所需的数据格式,且支持多种数据类型 (如DNA, RNA, SSR, AFLP, RFLP, SNPs, Allele frequence 等)。

PGDSpider 可以以多种数据格式做为输入文件,包括 VCF 格式! 很多软件声称可以处理 VCF,但是真正用的时候,总会遇到各种问题。使用 PGDSpider, 将会从此摆脱这种烦恼!

PGDSpider 可在各种常见数据格式之间进行转换,如下图:

二 下载安装

PGDSpider 是 Java 编译的软件,可在各个平台上安装使用 (Windows, Mac, Linux),其安装过程非常简单:

1 安装 Java。

2 下载最新版的软件(http://cmpg.unibe.ch/software/PGDSpider/)

三 使用方法

PGDSpider 是图形界面的软件,鼠标点击即可完成格式转换 (在定义好SPID 文件以后,其也可以用命令行执行)。下面来看一下具体的使用方法 (以从 VCF 格式转换为 Arlequin 格式为例):

  1. 打开软件,Windows 可以直接双击 PGDSpider2.exe; Linux 从终端运行 ./PGDSpider2.sh; Mac 从终端运行 java -Xmx1024m -Xms512M -jar PGDSpider2.jar:

  2. 定义输入文件和输出文件格式,并选择输入文件,定义输出文件路径及名称。

  3. 点击 Create/Edit SPID file,定义 SPID 文件:


    在这里可以定义物种的倍性,也可以对 VCF 文件进行一些过滤 (由于计算用的 VCF 一般都是做过过滤的,这里可以不再对可选项进行操作),最重要的是定义个体的群体信息。这个群体信息文件有 2 列,第一列是 VCF 文件内相应的个体名称,第二列是个体所对应的群体名称。完成这些操作后,点击 Save and Apply,定义 SPID 文件的名称和存储路径后保存即可。

  4. 点击 Convert 运行软件,待软件提示 translation completed 后即可得到相应的转换文件。

  5. 注意事项:





    请到「今天看啥」查看全文