照例回顾
Word 群体基因组 (一)
Word 群体基因组 (二)
初识Vcftools
Vcftools几乎可以做群体基因组学中的任何事情,前提是你得了解他所有的命令
下载安装
http://vcftools.sourceforge.net/
安装很简单 直接make 就好了
将所在路径加到环境变量,可以在任何文件夹调用
实例
杂合度自交系数检测
vcftools --vcf test.vcf --het --out test.spe.fre
去除--singletons数据,即所有样本中只有单个样本有SNP的情况
vcftools --vcf test.vcf --singletons --out test.spe.fre
计算窗口SNP 密度 500kb
vcftools --vcf test.vcf --SNPdensity 500000 --out test
只留下biallel
vcftools --vcf file1.vcf --min-alleles 2 --max-alleles 2 --recode --out
筛选个体
vcftools --vcf --keep --recode --out
计算Fst,单点计算
vcftools --vcf rice.all.filter.recode.vcf --weir-fst-pop ind.list --weir-fst-pop jap_trop.list --out fst
7. 保留nomissing位点
vcftools --vcf input_file.vcf --max-missing 1.0 --out output_noMissing
8. 提取特定位点之间SNP
vcftools --vcf input_file.vcf --chr 1 --recode --recode-INFO-all --out chr1 --from-bp --to-bp
9. 去除indel sites
vcftools --vcf input_file.vcf --remove-indels --recode --recode-INFO-all --out SNPs_only
10. 筛选个体+去除indel
vcftools --vcf *.vcf --remove-indels --recode --recode-INFO-all --out SNPs_only --keep
11. 筛选个体+去除indel+保留bia
vcftools --vcf *.vcf --remove-indels --min-alleles 2 --max-alleles 2 --recode --recode-INFO-all --out SNPs_only --keep
12. 筛选maf0.05 以上的