我有以下格式的数据,如果有第六列,我想提取第一列和第 6 列:
ID1 Bacteria;Firmicutes;Clostridia;Clostridiales;
ID2 Bacteria;Firmicutes;Clostridia;Clostridiales;Eubacteriaceae;Eubacterium;Eubacterium hallii;
ID3 Bacteria;Firmicutes;
ID4 Bacteria;Firmicutes;
ID5 Bacteria;Firmicutes;Clostridia;
ID6 Bacteria;
ID7 Bacteria;Firmicutes;Clostridia;Clostridiales;Ruminococcaceae;Faecalibacterium;
ID8 Bacteria;Firmicutes;Clostridia;Clostridiales;Ruminococcaceae;Faecalibacterium;Faecalibacterium prausnitzii;
输出应该是:
ID2 Eubacterium
ID7 Faecalibacterium
ID8 Faecalibacterium
我尝试通过用“;”分割来解决问题 并 grep 第六列cut -d ";" -f 6
,但认为你会有更好的解决方案。先感谢您!