我已经使用 gatk HaplotypeCaller 生成了一组大约 400 个 GVCF 文件,并带有-ERC GVCF
选项。我现在想将它们结合起来进行下游基因分型和变异重新校准。我相信我可以与 gatk CombineGVCFs 结合使用。
gatk CombineGVCFs \
-R reference.fasta \
--variant sample1.g.vcf.gz \
--variant sample2.g.vcf.gz \
-O cohort.g.vcf.gz
但我不知道的是,如何将我所有的 400 个 GVCF 文件输入到 CombineGVCF 中。我听说这可以通过--arguments_file
选项来完成,但我不知道如何构建这样的文件?
任何帮助都感激不尽!