plink-vcftools

bcftools

1
2
3
4
bgzip view.vcf  #bgzip压缩
bcftools view file.vcf -Oz -o file.vcf.gz #bgzip压缩

bcftools index view.vcf.gz #建立索引
1
2
bcftools view view.vcf.gz -s NA00001,NA00002  -o subset.vcf  #筛选样本
bcftools view view.vcf.gz -s ^NA00001,NA00002 -o subset.vcf # ^去除样本
1
bcftools sort view.vcf.gz -o sort.view.vcf  #排序vcf
1
2
3
4
5
6
bcftools reheader -s trans.file sample.vcf -o new.sample.vcf  #更改vcf文件中样本名

cat trans.file
NA00001 NA1
NA00002 NA2
NA00003 NA3
1
bcftools concat chr1.vcf.gz chr2.vcf.gz -o concat.vcf  #合并vcf文件
1
bcftools merge merge.a.vcf.gz merge.b.vcf.gz -o merge.vcf  #合并vcf文件(单样本多vcf文件)
1
2
bcftools stats view.vcf >  view.stats  #统计vcf文件
bcftools filter view.vcf.gz --regions chr16:17052042-17594883 > filter.vcf #选择固定区域SNP

vcftools

1
vcftools --vcf myvcf.vcf --plink --out myplink  #vcf2ped
1
2
vcftools --vcf myvcf.vcf --keep keep.txt --recode --out keep_sub  #vcf样本选择
vcftools --vcf myvcf.vcf --remove remove.txt --recode --out remove_sub #vcf样本删除
1
vcftools --vcf final.vcf --min-alleles 2.0 --max-alleles 2.0 --max-missing 0.95 --non-ref-af 0.05 --max-non-ref-af 0.95 --recode -c >filter.vcf  #vcf过滤
1
vcftools --vcf filter.vcf --thin  1000 --recode -c >thin.vcf  #按snp间隔过滤vcf
1
vcftools --gzvcf file.vcf.gz --positions specific_position.txt --recode --out specific_position.vcf  #选择指定SNP

plink

1
plink --vcf myvcf.vcf --recode --out myplink  #vcf2ped
1
plink --vcf myvcf.vcf --freq --out frquency #maf统计
1
plink --file FILENAME --make-bed --out FILENAME  #ped2bed
1
plink --bfile FILENAME --recode --out FILENAME  --noweb #bed2ped
1
plink --tfile FILENAME --recode --out FILENAME #tped2bed
1
plink --bfile FILENAME --recode transpose --out FILENAME --noweb #bed2tped
1
plink --bfile FILENAME --recode vcf-iid --out FILENAME #bed2vcf
1
2
plink --bfile FILENAME --indep-pairwise 50 5 0.5  #LD-pruning
plink --bfile FILENAME --extract plink.prune.in --make-bed --out data_pruned
1
plink -file FILENAME --recodeHV --out recode  #haploview

GATK

1
2
3
4
5
6
7
8
9
gatk-4.1.2.0/gatk --java-options "-Xmx10g"  HaplotypeCaller  -R Chr01.fa  --emit-ref-confidence GVCF  -I D1906306A.Chr01.realign.bam -O D1906306A.Chr01.realign.g.vcf

gatk-4.1.2.0/gatk --java-options "-Xmx10g" CombineGVCFs -R Chr01.fa -V D1905327A.Chr01.realign.g.vcf -V D1905328A.Chr01.realign.g.vcf -O all.raw.snps.indels.g.vcf

gatk-4.1.2.0/gatk --java-options "-Xmx10g" GenotypeGVCFs -R Chr01.fa -V all.raw.snps.indels.g.vcf -O Chr01.raw.snps.indels.vcf

gatk-4.1.2.0/gatk --java-options "-Xmx10g" SelectVariants --select-type-to-include SNP -R Chr01.fa -V Chr01.raw.snps.indels.vcf -O Chr01.snp.vcf

gatk-4.1.2.0/gatk --java-options "-Xmx10g" VariantFiltration -R Chr01.fa --filter-expression "QD < 2.0 || MQ < 40.0 || FS > 60.0 || SOR > 3.0 || MQRankSum < -12.5 || ReadPosRankSum < -8.0" --filter-name LowQualFilter --missing-values-evaluate-as-failing --variant Chr01.snp.vcf -O Chr01.filtered.vcf