我正在开发一个免费的网站站点地图应用程序。
我想问一下写在网络服务器日志文件中的请求网址的格式是什么?
我想解析这些日志文件以提取网站的各个页面。
每行中的格式是否总是“GET /mywebpage.html”?谢谢 !
我正在开发一个免费的网站站点地图应用程序。
我想问一下写在网络服务器日志文件中的请求网址的格式是什么?
我想解析这些日志文件以提取网站的各个页面。
每行中的格式是否总是“GET /mywebpage.html”?谢谢 !
到目前为止,最常见的格式是Apache CLF(Common Log Format 或 Combined Log Format):
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-agent}i\"" combined
要获得更好的答案,您需要指定正在使用的网络服务器,或者至少显示示例日志行。
它并不总是相同的 - 默认值因服务器而异,并且是可配置的。例如,在 Apache 中,您可以在配置中设置CustomLog指令,并允许完全自定义记录的信息、记录的顺序和记录到的文件。