2

我正在尝试使用 gawk 从日志中提取段落,并且在我想要包含它找到的记录分隔符之前它工作得很好。

这是命令:

gawk --re-interval 'BEGIN{RS="[0-9]{1,2}:[0-9]{1,2}:[0-9]{1,2}.[0-9]{1,6} \\[[A-Z]*\\]";} /983a99f8-bec6-11e1-80dd-059a821d0b73/ {print $0}' full.log 

如果我添加 print RT, $0,它会打印下一个匹配的 RT,而不是当前匹配。

这是一些示例文本

9:08:06.899627 [DEBUG] <0.30065.3>@agent:1565 Recs to loop through:  [{agent_state,"OpenAcdAgent43","Jeff",
                            undefined,wrapup,
                            {call,"983a99f8-bec6-11e1-80dd-059a821d0b73",
                                voice,
                                {"8501112234","MorganGrimes"},
                                "9201",<0.30392.3>,[],
                                {client,"8221314","DCF",[],1340629596,
                                    1340629596},
                                [creole_general],
                                <0.30398.3>,outband,inband,inbound,10},
                            1340629658,undefined,"Default",1340629658
9:08:06.899707 [INFO] <0.168.0>@cpx_monitor:649 Down message for reference #Ref<0.0.16.137225> of <0.30064.3> due to normal

我想要 9:08:06.899627 [DEBUG] 能够做的是在我的比赛前添加 9:08:06.899627 [DEBUG] 但 RS 将其取消。我得到 9:08:06.899707 [INFO] 代替。

谢谢!

4

1 回答 1

6

那是因为记录分隔符出现在记录的末尾9:08:06.899627 [DEBUG]空记录的结尾也是如此9:08:06.899707 [INFO],与您的 GUID 正则表达式匹配的记录的结尾也是如此。

您需要保存上一个RT并输出保存的。

gawk --re-interval 'BEGIN{RS="[0-9]{1,2}:[0-9]{1,2}:[0-9]{1,2}.[0-9]{1,6} \\[[A-Z]*\\]";} /983a99f8-bec6-11e1-80dd-059a821d0b73/ {print savedRT, $0} {savedRT = RT}' full.log 
于 2012-06-25T23:41:23.390 回答