bash - 有没有一种简单的方法可以用 bash 计算分位数？

Question

假设我有一个来自 Web 服务器的日志文件，其中包含每个请求的响应时间：

_1st_request 1334
_2nd_request 345
_3rd_request 244
_4th_request 648
......... etc

bash 脚本是否有一种简单的方法可以找到最高十分位数（10分位数）？换句话说，回答这个问题：如果我排除最慢的 10% 的请求，最慢的请求有多慢？

score 5 · Accepted Answer

awk '{print $2}' | sort -rn | perl -e '$d=.1;@l=<>;print $l[int($d*$#l)]'

在 perl 中完成整个事情确实会更优雅。如果要使用临时文件，可以使用 wc + head/tail 从排序的数字列表中选择分位数。

score 1 · Accepted Answer

我可能会按请求字段对行数进行数字排序，然后从末尾抓取 10% 的行。

FILE=responseTimes.log
TMPFILE=tmpfile
sort -k 2 -n $FILE > $TMPFILE
LINECOUNT=`wc -l $TMPFILE | sed -e 's/^ *//' -e 's/ .*$//'`
TARGETLINE=echo "$LINECOUNT * 9 / 10" | bc
sed -n "$TARGETLINE{p;q;}" $TMPFILE

希望这就是你要找的。

bash - 有没有一种简单的方法可以用 bash 计算分位数？

2 回答 2

Related

Reference