我有一个以下格式的文本文件。每行都有可变数量的列。
文件:
gi|269201691|ref|YP_003280960.1| chromosomal replication initiation protein gi|57651109|ref|YP_184912.1| chromosomal replication initiation protein % 1 0.0 2296 100.0
gi|269201692|ref|YP_003280961.1| DNA polymerase III subunit beta gi|57651110|ref|YP_184913.1| DNA polymerase III subunit beta % 1 0.0 1964 100.0
生成的文件应如下所示:
gi|269201691|ref|YP_003280960.1| gi|57651109|ref|YP_184912.1| % 1 0.0 2296 100.0
gi|269201694|ref|YP_003280963.1| gi|57651112|ref|YP_184915.1| % 1 0.0 1767 100.0
下面的代码有助于在每行中查找模式为“ref”的列。
awk '{for (i=1;i<=NF;i++) if ($i ~ /ref/) print $i }'
关于如何做同样的任何想法?