16

我可以编写一个简单的脚本来执行此操作,但在我不断寻求更熟悉 unix 的过程中,我想学习使用内置命令的有效方法。

我需要处理具有可变数量的标题行的非常大的文件。最后一个标题行由文本“LastHeaderLine”组成。我希望在此行之后输出所有内容。(我不担心误报匹配。)

4

3 回答 3

27

类似于Avi的答案,但不包括带有“LastHeaderLine”的行。

sed -e '1,/LastHeaderLine/d'
于 2008-10-13T10:19:30.667 回答
13

为什么不为此尝试 awk 呢?它看起来像这样:

awk 'NR == 1, /LastHeaderLine/ { next } { print }' myinputfile > myoutputfile

其中NR == 1对于第一行是正确的,/LastHeaderLine/匹配您的最后一个标题行。逗号运算符让以下函数{ next }为两个正则表达式范围内的所有句子触发。在这种情况下,它将跳到下一行输入,无需进一步操作。对于所有其他输入行,它会将这些行打印到标准输出,您可以使用 > 重定向。

于 2008-10-13T10:12:37.607 回答
11

使用 sed:

sed -ne '/LastHeaderLine/,$p' <inputfile

将匹配从正则表达式匹配到文件末尾的所有内容。'p' 打印匹配的行。

编辑:

再三考虑,您不想打印匹配 LastHeaderLine 的行。sed 很难做到这一点。在 perl 中,您可以执行以下操作:

perl -ne 'if ($flag) {print;} if (/LastHeaderFile/) {$flag=1;}' <inputfile

这将仅打印严格遵循正则表达式匹配的行。

于 2008-10-13T10:09:47.377 回答