0

我在手臂架构上运行。应该是一个 bash 脚本。我想绘制进出我的 ftp 服务器的总字节数。

我使用此命令解析 ftp.log 文件以获取此输出:

    `cat ftp.log | grep loaded`

有趣的行是这种格式:

Sep 14 18:46:00 sharecenter pure-ftpd: (doc@omega) [NOTICE] /mnt/HD/HD_a2//SAVE/backupffp.sh downloaded (423 bytes, 0.78KB/sec) Sep 15 22:06:47 sharecenter pure-ftpd: (doc@omega) [NOTICE] /mnt/HD/HD_a2//SAVE/ffp-2013-09-14.tar.bz2 downloaded (904753213 bytes, 1928.17KB/sec) Sep 15 22:32:26 sharecenter pure-ftpd: (doc@omega) [NOTICE] /mnt/HD/HD_a2//SAVE/test.avi uploaded (576711530 bytes, 1465.80KB/sec)

现在我需要获取“(”之后和“字节”一词之前的值并添加它们。

  • 例子:

--> 下载的 423+904753213=904753636 => 返回值:904753636

--> 上传 576711530 => 返回值:576711530

现在脚本将每 5 分钟运行一次,因此结果必须仅考虑最后 5 分钟之间的数字。示例:在 22:05 脚本运行并添加所有字节。当脚本在 22:10 再次运行时,仅应添加 22:05 到 22:10 之间传输的字节。

对于 rrd,您需要一个简单的输出,2 个变量“dowloaded”和“uploaded”。所以我需要这两个变量中的这两个值。

我希望我足够清楚,如果不是毫不犹豫地询问更多信息。

非常感谢您的帮助。

4

2 回答 2

0

这个版本对格式会很严格。即使某些部分会在文件 URL 中添加空格,它也会起作用。

#!/usr/bin/awk -f

BEGIN {
    u = d = 0
}

match($0, / downloaded  \([0-9]+/) {
    d += substr($0, RSTART + 14, RLENGTH - 14)
    next
}

match($0, / uploaded  \([0-9]+/) {
    u += substr($0, RSTART + 12, RLENGTH - 12)
}

END {
    printf("downloaded=%d\nuploaded=%d\n", d, u)  ## You can change this to have desired format of output.
}

输出:

> awk -f script.awk file
downloaded=904753636
uploaded=576711530

压缩格式:

awk 'BEGIN{u=d=0}match($0,/ downloaded  \([0-9]+/){d+=substr($0,RSTART+14,RLENGTH-14);next}match($0,/ uploaded  \([0-9]+/){u+=substr($0,RSTART+12,RLENGTH-12)}END{printf("downloaded=%d\nuploaded=%d\n",d,u)}' file

要在 bash 脚本上运行它,请通过进程替换将 awk 作为输入运行,将格式更改为"%d\n%d\n"并读取包含两个变量的两行:

#!/bin/bash
{ read downloaded; read uploaded; } < <(exec awk 'BEGIN{u=d=0}match($0,/ downloaded  \([0-9]+/){d+=substr($0,RSTART+14,RLENGTH-14);next}match($0,/ uploaded  \([0-9]+/){u+=substr($0,RSTART+12,RLENGTH-12)}END{printf("%d\n%d\n",d,u)}' file)
echo "Downloaded: $downloaded"
echo "Uploaded: $uploaded"
于 2013-09-15T21:20:00.160 回答
0

有很多方法可以做到这一点。这个很有趣:

for i in $(grep -P -o '(?<=downloaded \()[0-9]+(?= bytes)' file.txt); do ((downloaded+=i)); done
echo "Downloaded: $downloaded"


现在脚本将每 5 分钟运行一次,因此结果必须仅考虑最后 5 分钟之间的数字。

也有很多方法可以做到这一点。其中之一是使用tail -f而不是每 5 分钟运行一次。另一种方法是记住文件行数(例如使用wc -l),然后您可以使用 tail 仅获取附加部分。

于 2013-09-15T21:22:21.560 回答