我正在 BASH 中编写一个脚本,该脚本需要检查日志文件中的错误条目。我计划每小时运行一次,所以我只想让它只返回过去一小时内发生的错误类型条目(所有服务器时间都是格林威治标准时间)。我建立以下变量
# Log file directory
LOGPATH="/path/to/logs/"
# Current date and time
CURDATE=`date +%Y-%m-%d`
CURTIME=`date +%H:%M:%S`
# Old date and time
OLDDATE=`date +%Y-%m-%d -d "1 hour ago"`
OLDTIME=`date +%H:%M:%S -d "1 hour ago"`
所有日志文件都遵循 ktYEAR-MONTH-DAY.root.log.txt 的文件名格式,其中 YEAR/MONTH/DAY 替换为记录条目的日期。例如,今天的日志文件为 kt2011-08 -15.root.log.txt。内容的示例条目是
2011-08-15 | 19:30:02 | ERROR | 18333 | 337 | n/a | dms | default | error | XMLRPC Lucene - addDocument - Reason: Failed to parse XML-RPC request: An invalid XML character (Unicode: 0xb) was found in the element content of the document.
感兴趣的列是第 1、2、3 列(值可能是“INFO”、“DEBUG”等,但只有当“ERROR”是值时才感兴趣)和最后一列是日志消息的正文。
我想要完成的是让这个 BASH 脚本解析具有跨越活动最后一小时的条目的文件(如第 1 列和第 2 列中所定义),并且如果第 4 列包含字符串“ERROR”,然后显示最右边一列的内容。当我试图确定如何根据$CURTIME
an解析日志文件时,我感到困惑$OLDTIME
,当午夜到来时变得更糟,然后我必须搜索前一天的日志文件。我不希望对所有日志文件进行全面的 grep 样式搜索,因为数量和大小可能过多,但如果必须这样做,那就这样吧。