感谢大家抽出时间并提出建议。现在我已经到达了我需要获取报告的地方,该报告将在每小时内计算每个文档的每个消费者。
我想出了这个逻辑,首先在 awk 数组中获取小时、文档、消费者,然后每小时获取文档,然后为该文档获取消费者和同一消费者的计数,然后是 avg_rtime。
这是我的输入日志文件。
document| consumer| hour| rtime|
cust_CreateDocument OLS 23 670
cust_GetDocumentContentStream LDS 14 685
cust_CreateDocument OLS 17 767
cust_GetDocumentContentStream LDS 15 1186
cust_DumpDocumentProperties OLS 15 928
cust_GetDocumentContentStream CPI 0 462
cust_GetDocumentContentStream CPI 0 1338
cust_GetDocument LDS 11 413
cust_GetDocumentContentStream LDS 0 1527
cust_GetDocumentContentStream LDS 0 473
以下格式的必需输出。
Hour | document| consumer |count| avg_of_rtime|
0 cust_GetDocumentContentStream LDS 2 1000=(1525+473)/2#How to compute avg_rtime
0 cust_GetDocumentContentStream CPI 2 900=(462+1338)/2
14 cust_GetDocumentContentStream LDS 1 685=(685/1)