我需要对几 TB 的日志数据进行切片,并且更喜欢命令行的速度。我会在处理之前将文件分成块,但需要删除一些部分。
以下是格式示例:
uuJ oPz eeOO 109 66 8
uuJ oPz eeOO 48 0 221
uuJ oPz eeOO 9 674 3
kf iiiTti oP 88 909 19
mxmx lo uUui 2 9 771
mxmx lo uUui 577 765 27878456
前 3 个字母数字字符串之间的间隔是空格。之后的一切都是标签。行用 分隔 \n
。
我只想保留每组中的最后一行。
如果组中只有 1 行,则应保留。
这是预期的输出:
uuJ oPz eeOO 9 674 3
kf iiiTti oP 88 909 19
mxmx lo uUui 577 765 27878456
我如何使用 sed、awk、xargs 和朋友来做到这一点,或者我应该只使用更高级别的东西,比如 Python?