我正在尝试对传递给我的一组 Apache 访问日志执行一些数据分析,但我注意到这些日志似乎不是传统格式(基于我在网上找到的一些其他 Apache 日志示例)。以下是从我的一个日志文件中提取的一行(经过一些匿名化处理):
2013-08-25 10:06:11 EDT - "GET http://www.siteaddress.com/section/aaa/z/directory HTTP/1.1" 404 1677 1.2.181.171 "-" "Mozilla/4.0 (compatible; MSIE 4.01; Windows 98)" - 0 155311 -
有什么方法可以找出记录这些日志的格式吗?也就是说,我将如何为这个文件获取某种标题?Ps.:我可以访问正在捕获这些日志的服务器,并且可以使用它来查找该信息。
编辑1:有人告诉我检查/etc/apache2/httpd.conf的内容,我发现它是空的。
编辑 2:在apache2.conf中找到了以下相关部分,但我不太确定这些是否与我在日志中看到的相符。
# The following directives define some format nicknames for use with
# a CustomLog directive (see below).
# If you are behind a reverse proxy, you might want to change %h into %{X-Forwarded-For}i
LogFormat "%v:%p %h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" vhost_combined
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
LogFormat "%h %l %u %t \"%r\" %>s %b" common
LogFormat "%{Referer}i -> %U" referer
LogFormat "%{User-agent}i" agent
编辑 3:在/etc/apache2/sites-available/hub 中找到它,它似乎符合我的格式(非常感谢!)
LogFormat "%{%Y-%m-%d %H:%M:%S %Z}t %u \"%r\" %>s %B %a \"%{Referer}i\" \"%{User-Agent}i\" - %T %D -"