如何提取 Linux (csh) 中特定单词之后的单词?更准确地说,我有一个文件,它有一行,如下所示:
[some useless data] --pe_cnt 100 --rd_cnt 1000 [some more data]
我想提取单词100
后面的数字。--pe_cnt
我不能使用 sed,因为它仅在您想提取整行时才有效。也许我可以使用awk?
另外,我有多个文件具有不同的值,而不是100
所以我需要一些提取值但不依赖于值的东西。
与awk
:
awk '{for(i=1;i<=NF;i++) if ($i=="--pe_cnt") print $(i+1)}' inputFile
基本上循环遍历该行的每个单词。当你找到你要找的第一个单词时,抓住下一个单词并打印出来。
与grep
:
grep -oP "(?<=--pe_cnt )[^ ]+" inputFile
您可以使用 sed。只需制作一组您想要匹配的想要并用该组替换整行:
sed -n 's/^.*pe_cnt\s\+\([0-9]\+\).*$/\1/p' file
--pe_cnt
如果和之间有一个空格字符100
,您可以使用前瞻和后瞻断言
grep -oP '(?<=--pe_cnt\s)\d+(?=\s+--rd_cnt)'
这可能是最短的版本:
grep -oP 'pe_cnt \K[^ ]+' file