3

在课堂上,我们被分配解析访问日志并记录所有成功的尝试。在研究 Apache Web 服务器访问日志时,我遇到了几个实例,大约 3/100,000 的日志格式不正确。日志将显示为,例如,96.45.3.2 - - [14/Mar/2011:00:12:33 -0400] "GET webpage.html HTTP/1.1" 400 236 - -

我不是在问如何解析文件,我只是好奇如果格式没有完成会发生什么?用户的浏览器是否出现故障?停电?等等。

此外,在解析文件时,我注意到在一个特定实例中,索引 [8](应该是 200,300,400,500 个代码)在索引 [8] 为 1.1 时出现了错误。

有任何想法吗?

4

1 回答 1

0

'-' 只是表示该字段信息不可用(http://httpd.apache.org/docs/2.2/logs.html)。最后两个连字符仅表示发出消息时不存在任何应该记录的信息。

关于 index[8] 的第二部分是您正在对日志行的格式做出假设。我敢打赌,您在空格上进行拆分,并且该行的前面有一个空格。

于 2012-03-12T21:48:22.577 回答