我为三个样本中的每一个都制作了一个 vcf 文件。然后我使用 bcftools 将它们组合起来,如下所示:
# Make a list of vcf files to merge
cat "${OUT}/results/variants/vcf_list"
/mnt/gpfs/live/rd01__/ritd-ag-project-rd018o-mdflo13/data/test/manual/results/variants/3a7a-10.vcf.gz
/mnt/gpfs/live/rd01__/ritd-ag-project-rd018o-mdflo13/data/test/manual/results/variants/MF3.vcf.gz
/mnt/gpfs/live/rd01__/ritd-ag-project-rd018o-mdflo13/data/test/manual/results/variants/R507H-FB_S355_L001.vcf.gz
然后合并列表:
bcftools merge -l "${OUT}/results/variants/vcf_list" -Ov -o "${OUT}/results/variants/merge_individuals.vcf"
并将其编入索引:
tabix -p vcf "${OUT}/results/variants/merge_individuals.vcf.gz"
生成的合并 vcf 似乎有三列,每个样本一列。当我在 IGV 中打开它时,所有变体都分配给样本 3a7a(见图)
但是当我在 GenomeBrowse 中打开它时,我看到它们正确分配给了三个样本中的每一个:
我想不通是怎么回事?我在这里上传了单个和合并的 vcf 文件。非常感谢任何帮助