linux - 解压缩，但仅使用 unix 提取某些文件

Question

我有一个 5-6 gigs 61,213,301 行的大文本文件。它处于逗号分隔状态。

field1,field2,,,field5,,,field8...

因为我不想将整个内容提取到 csv 中（更像是我不能）。我正在尝试提取某些行，例如 field2 = ABC。

我目前正在将所有内容提取到一个新文件中

gzip -dc 20130516.ticks.gz | cut -d, -f2,17,18,20-36  > ~/test/20130516.file

有没有办法只提取带有 field2=ABC 的行，或者从 20130516.file 中提取它，只带有 field2=ABC ？

score 2 · Accepted Answer

2

使用awk：

gzip -dc 20130516.ticks.gz | awk -F, '$2 == "ABC"' > output.csv

于 2013-05-21T14:09:42.710 回答

1 回答 1