0

我有一个 5-6 gigs 61,213,301 行的大文本文件。它处于逗号分隔状态。

field1,field2,,,field5,,,field8... 

因为我不想将整个内容提取到 csv 中(更像是我不能)。我正在尝试提取某些行,例如 field2 = ABC。

我目前正在将所有内容提取到一个新文件中

gzip -dc 20130516.ticks.gz | cut -d, -f2,17,18,20-36  > ~/test/20130516.file

有没有办法只提取带有 field2=ABC 的行,或者从 20130516.file 中提取它,只带有 field2=ABC ?

4

1 回答 1

2

使用awk

gzip -dc 20130516.ticks.gz | awk -F, '$2 == "ABC"' > output.csv
于 2013-05-21T14:09:42.710 回答