我无法分离我的文件:
chr2 215672546 rs6435862 G T 54.00 LowDP;sb DP=10;TI=NM_000465;GI=BARD1;FC=Silent ... ...
我想打印前七个字段,然后从第 8 个字段打印DP=10
和GI=BARD1
。DP
in GI
info 总是在第 8 个字段中。字段继续(...),因此第 8 个字段不是最后一个。
我知道如何提取第 8 个字段:
awk '{print $8}' PLZ-10_S2.vcf | awk -F ";" '/DP/ {OFS="\t"} {print $1}'
当然如何提取前七个字段,但是如何将它们连接在一起呢?所有字段之间是tab
.