我计划将网页请求的请求日志从 mongo 迁移到 nginx 日志。是否有一些解析器/工具可用于解析日志并将其转换为 JSON,以使它们看起来更有意义,以便我可以查询它们?
当前的 mongo 日志格式:
{ "_id" : ObjectId("4f911646e4b00a6b7b103c77"), "mUpdatedAt" : NumberLong("1334908486975"), "playerError" : "", "playerState" : "paused", "requestUuid" : "d2c8c8aa-aeab-4f87-8db0-ed699ba19249" }
Nginx 日志格式:
115.249.242.17 - - [18/May/2012:05:40:49 +0000] "GET /flashlayer?videoId=NaN&duration=26.091&videoLoadTime=216&videoBitRate=1708 HTTP/1.1" 200 86 "-" "Mozilla/5.0 (Windows NT 6.1; rv:12.0) Gecko/20100101 Firefox/12.0"
我可以在 mongoDB 上查询,我也希望对 nginx 日志进行同样的查询,为此我需要一个简单的解析器来读取 nginx 日志并转换为 JSON、CSV 或将其放入 hive、HDFS 中。
谢谢