我有一个大型的制表符分隔数据库,如下所示:
1 14933 14933 G A ID=COSN404397;OCCURENCE=1(lung)
1 14948 14948 G A ID=COSN415697,COSN415698;OCCURENCE=2(urinary_tract)
1 69537 69537 G T ID=COSM536198;OCCURENCE=1(lung)
1 69538 69538 G A ID=COSM75742;OCCURENCE=1(ovary)
...
我正在尝试使用 awk 或 grep 仅保留 OCCURENCE >= 3 的行(是的,它在整个数据库中拼写错误!),但我似乎无法弄清楚如何最好地拆分/扫描第 6 列...