Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个 Apache 服务器日志,正在尝试确定哪个 IP 地址产生了最多的流量。我已经设法将其格式化,因此它只是 IP 及其流量(以字节为单位):
xxx.xxx.xxx.xxx 915925 yyy.yyy.yyy.yyy 1193 zzz.zzz.zzz.zzz 2356
所以现在我正在寻找一种方法来组合和添加相同 IP 的字节,然后找到最高值。
有任何想法吗?
如果文件中有 ip 和流量字节,请使用以下内容完成工作。
cat file | perl -ane '$h{ $F[0] } += $F[1]; END { for ( sort keys %h ) { printf qq[%s %d\n], $_, $h{ $_ } } }' | sort -k2 -n -r
awk '{A[$1]+=$2;next}END{for(i in A){print i,A[i]}}' file | sort -k2 -n -r