我有一个像这样的数百万行的日志
1482364800 bunch of stuff 172.169.49.138 252377 + many other things
1482364808 bunch of stuff 128.169.49.111 131177 + many other things
1482364810 bunch of stuff 2001:db8:0:0:0:0:2:1 124322 + many other things
1482364900 bunch of stuff 128.169.49.112 849231 + many other things
1482364940 bunch of stuff 128.169.49.218 623423 + many other things
它太大了,我无法真正将它读入内存以供 python 解析,所以我只想将我需要的项目 zgrep 出到另一个较小的文件中,但我对 grep 不是很好。在 python 中,我通常会打开.gzip(log.gz) 然后将 data[0],data[4],data[5] 提取到一个新文件中,这样我的新文件只有 epoc 和 ip 以及日期(ip 可以是 ipv6 或 4)
新文件的预期结果:
1482364800 172.169.49.138 252377
1482364808 128.169.49.111 131177
1482364810 2001:db8:0:0:0:0:2:1 124322
1482364900 128.169.49.112 849231
1482364940 128.169.49.218 623423
我该怎么做这个zgrep?
谢谢