我在 column1 和 column2 中有一堆文本文件,其中包含以下内容(用空格分隔):
地址0数据0
地址 1 数据 1
.
.
.
地址N 数据N
所有数据值都是唯一的(随机),但有些地址值是重复的。如何使用 AWK / sort / uniq 删除已指定地址的行?
基本上,文本文件中不应该有重复的地址,无论关联的数据是什么。
awk '
$1 in seen {next}
{print; seen[$1] = 1}
' file ...
sort -k1 your_file | awk '{ if ($1 != last_address_seen) {print $0; last_address_seen=$1}}'
sort -k1 -u your_file > outputfile
大多数 unix 排序命令将支持 -u 选项,该选项将仅保留在所有键上比较相等的两行中的第一行。