4

我有一个表格格式的巨大数据文件要分析。我感兴趣的主要有两列,其中一列包含字母数字字母的名称(第 1 列),另一列包含百分比数字(第 3 列)。

我的要求是根据第 3 列的值对数据进行反向排序,应用一些阈值 (>10.0) 并仅显示符合此条件的所需行,其中第 1 列和第 3 列按排序顺序排列。

一般我写一个小脚perl本来实现这样的要求。但是在这里,我正在寻找一系列 linux 命令(一个班轮)来快速有效地解决它。

样本输入

abc12   24.5     90.0    5  
xyz23   454.23   23.5    2
aa34cd  1.345    12.34   6
uvxy    4.25     54.7    1
pqr3t   235.3    6.05    4
abcd    1.234    4.56    3

期望的输出

abc12   90.0
uvxy    54.7
xyz23   23.5
aa34cd  12.34

如果您能帮我解决这个问题,那将是不胜感激的。

我试过什么?

我可以使用以下命令对第 3 列进行反向排序。不知道接下来会发生什么!

awk '{print $3}' test.txt | sort -rn
4

1 回答 1

5

如果第三个大于 10,则仅打印第一个和第三个字段,然后对第二个字段进行数字逆序排序:

$ awk '$3>10{print $1,$3}' file | sort -nrk 2
abc12    90.0
uvxy     54.7
xyz23    23.5
aa34cd   12.34
于 2013-09-27T07:53:10.930 回答