1

我已经使用 gatk HaplotypeCaller 生成了一组大约 400 个 GVCF 文件,并带有-ERC GVCF选项。我现在想将它们结合起来进行下游基因分型和变异重新校准。我相信我可以与 gatk CombineGVCFs 结合使用。

gatk CombineGVCFs \
   -R reference.fasta \
   --variant sample1.g.vcf.gz \
   --variant sample2.g.vcf.gz \
   -O cohort.g.vcf.gz

但我不知道的是,如何将我所有的 400 个 GVCF 文件输入到 CombineGVCF 中。我听说这可以通过--arguments_file选项来完成,但我不知道如何构建这样的文件?

任何帮助都感激不尽!

4

1 回答 1

1

首先,您需要创建一个包含要组合的所有 GVCF 的文本文件:

ls gvcfs/*.vcf >gvcfs.list

然后使用CombineGVCFs

gatk --java-options "-Xmx180G -XX:ParallelGCThreads=36" CombineGVCFs -R $ref --variant gvcfs.list --dbsnp $DBSNP -O combined_gvcf.vcf
于 2022-01-05T15:35:25.087 回答