0

我得到以下格式的一些月度统计数据,我需要做的是为每一列获取最小和最大,我已经使用awk这个脚本从一个更大的文件中取出表格

awk 'c-->3;/By Day/{c=35; print}' file1.txt

并获得输出:

按天:

 Separate user logon counts-(max sessions)-(external counts)-(lock actions):
 2013/04/07 -      6    (   6)  (  37)  (   0)
 2013/04/08 -    190    (  70)  (6528)  (  30)
 2013/04/09 -    185    (  68)  (5986)  (  29)
 2013/04/10 -    213    (  85)  (5571)  (  36)
 2013/04/11 -    189    (  82)  (5410)  (  35)
 2013/04/12 -    165    (  69)  (5130)  (  25)
 2013/04/13 -     16    (  15)  ( 662)  (   0)
 2013/04/14 -     20    (  14)  (1016)  (   2)
 2013/04/15 -    160    (  64)  (6770)  (  39)
 2013/04/16 -    205    (  96)  (5978)  (  25)
 2013/04/17 -    197    (  83)  (5816)  (  37)
 2013/04/18 -    167    (  78)  (5554)  (  38)
 2013/04/19 -    152    (  71)  (5479)  (  29)
 2013/04/20 -     18    (  10)  ( 578)  (   1)
 2013/04/21 -     11    (   7)  (1018)  (   2)
 2013/04/22 -    193    (  74)  (6931)  (  30)
 2013/04/23 -    176    (  66)  (6184)  (  23)
 2013/04/24 -    192    (  74)  (5891)  (  26)
 2013/04/25 -    188    (  79)  (5575)  (  28)
 2013/04/26 -    170    (  75)  (5513)  (  26)
 2013/04/27 -     17    (  12)  ( 597)  (   0)
 2013/04/28 -     17    (  10)  (1021)  (   0)
 2013/04/29 -    193    (  79)  (6786)  (  38)
 2013/04/30 -    217    (  87)  (6094)  (  36)
 2013/05/01 -    185    (  82)  (5706)  (  32)
 2013/05/02 -    188    (  76)  (5602)  (  29)
 2013/05/03 -    167    (  63)  (5149)  (  21)
 2013/05/04 -     22    (  14)  ( 634)  (   1)
 2013/05/05 -     21    (  14)  ( 728)  (   1)
 2013/05/06 -      2    (   8)  (  46)  (   0)

我可以编辑awk脚本以按设置列排序并仅显示已排序的列和第一列吗?

4

2 回答 2

0

我很确定你的脚本是巧合的。就目前而言,您减少变量c并测试输入中每一行的变量是否大于 3。根据结果​​,将打印该行,因为将执行默认块。第二个块似乎没用,因为它匹配包含By Day但您的输入包含单个匹配的行?就目前而言,c它将被初始化为 0,因为仅递减意味着条件c-->3永远不会为真,因此该脚本不会使用当前输入打印任何内容!?

awk 'c-->3;/By Day/{c=35; print}' file1.txt

您应该发布原始文件以获取有关如何重写此脚本的帮助。


忽略您的awk脚本并采用您当前的输入,我将删除括号并使用sort. 例如对第五列进行数字排序:

$ sed 's/[()]//g' file | sort -nk5 | awk '{print $1,$5}'
Separate sessions-external
2013/04/07 37
2013/05/06 46
2013/04/20 578
2013/04/27 597
2013/05/04 634
2013/04/13 662
2013/05/05 728
2013/04/14 1016
2013/04/21 1018
2013/04/28 1021
2013/04/12 5130
2013/05/03 5149
2013/04/11 5410
2013/04/19 5479
2013/04/26 5513
2013/04/18 5554
2013/04/10 5571
2013/04/25 5575
2013/05/02 5602
2013/05/01 5706
2013/04/17 5816
2013/04/24 5891
2013/04/16 5978
2013/04/09 5986
2013/04/30 6094
2013/04/23 6184
2013/04/08 6528
2013/04/15 6770
2013/04/29 6786
2013/04/22 6931

编辑:

如果您有,在比赛前 3 行打印 35 的最简单方法GNU grep

grep -A35 -B3 'By Day' file

然后使用数字排序选项进行管道排序-n,并指定列-k并使用cutawk仅抓取您想要的列。

于 2013-05-15T10:22:05.727 回答
0

打印包含“By Day”的行和随后的 35 行的正确方法是:

awk '/By Day/{c=36} c&&c--' file1.txt

现在,发布一些有代表性的输入(不,我们不需要它是 35 行 - 使其为 5 或更少)以及该输入的预期输出,我们可以看看你接下来想要做什么。

我从评论中看到您也想在“By Day”之前打印 3 行。这本身就是:

awk '
/By Day/{
    for (i=0;i<3;i++) {
        j=(NR+i)%3
        if (j in buf) {
            print buf[j]
        }
    }
}
{ buf[NR%3]=$0 }
' file

所以你可以将它们组合为:

awk -v pre=3 -v post=35 '
/By Day/{
    for (i=0;i<pre;i++) {
        j = (NR+i) % pre
        if (j in buf) {
            print buf[j]
        }
    }
    c = post + 1
}
{ buf[NR%pre]=$0 }
c&&c--
' file
于 2013-05-15T12:32:14.597 回答