bash - bash 脚本：查找最大值、分组依据和按列排序

Question

我有一个看起来像这样的文件：

b, 20, 434
a, 20, 23
a, 10, 123
a, 20, 423
a, 10, 89
b, 20, 88
b, 10, 133
b, 10, 99

也就是说，输出应该是文件应该是

a, 10, 123
a, 20, 423
b, 10, 133
b, 20, 434

如何在 bash 脚本中执行此操作？谢谢你的帮助。

score 5 · Accepted Answer

这可以完成工作：

< input sort -k3,3gr | sort -k1,1 -k2,2g -u

它在第三个字段上以相反的顺序对数字进行排序，然后对第一个和第二个字段进行排序，仅采用第一次出现（-u 表示唯一）。

您不需要填充，即如果您在输入中添加一行

a, 3, 31

输出是：

a, 3, 31
a, 10, 123
a, 20, 423
b, 10, 133
b, 20, 434

score 2 · Accepted Answer

这会稍微修改空格，但也许这是可以接受的：

awk '$3 > a[$1,$2] { a[$1,$2] = $3 } END {for( k in a) print k a[k]}' input |
    sort -n -t, -k1,1 -k2,2

但是该解决方案高度依赖于输入中的空格，因此最好执行以下操作：

awk '$3 > a[$1","$2] { a[$1","$2] = $3 } 
    END {for( k in a) print k "," a[k]}' FS=, input |
    sort -n -t, -k1,1 -k2,2

2 回答 2