sorting - 在使用 AWK / sort / uniq 从简单文本文件中删除第一列中具有相同值的行时需要及时帮助

Question

我在 column1 和 column2 中有一堆文本文件，其中包含以下内容（用空格分隔）：

地址0数据0

地址 1 数据 1

.

地址N 数据N

所有数据值都是唯一的（随机），但有些地址值是重复的。如何使用 AWK / sort / uniq 删除已指定地址的行？

基本上，文本文件中不应该有重复的地址，无论关联的数据是什么。

score 1 · Accepted Answer

1

awk '
    $1 in seen {next}
    {print; seen[$1] = 1}
' file ...

于 2010-11-11T14:41:49.520 回答

score 0 · Accepted Answer

0

sort -k1 your_file | awk '{ if ($1 != last_address_seen) {print $0; last_address_seen=$1}}'

于 2010-11-11T13:26:39.890 回答

score 0 · Accepted Answer

sort -k1 -u your_file > outputfile

大多数 unix 排序命令将支持 -u 选项，该选项将仅保留在所有键上比较相等的两行中的第一行。

3 回答 3