我有一个多样本 vcf 文件,我想在左列中获取一个 ID 表,其中包含它们具有备用等位基因的变体。它应该如下所示:
ID1 chr2:87432:A:T_0/1 chr10:43234:C:G_1/1
ID2 chr2:87432_A:T_1/1
ID3 chr11:432434:T:G chr14:34234234:C:G chr20:34324234:T:C
这是然后读入R
我尝试过以下组合:
bcftools query -f '[%SAMPLE\t] %CHROM:%POS:%REF:%ALT[%GT]\n'
但我不断在同一行上重叠样本 ID,我无法完全弄清楚 sytnax。
您的帮助将不胜感激