我不太确定这是否是发布我的问题的合适论坛。我正在分析 Apache 和 IIS 日志格式的 Web 服务器日志。我想找到自动浏览的证据(例如 Web 机器人、蜘蛛、机器人等)。我使用 python robots -detection 0.2.8来检测日志文件中的机器人。无论如何,可能有其他机器人(自动程序)已经遍历该网站,但机器人检测无法识别。
- 那么在日志文件中是否可以找到任何特定的线索(人类用户不执行但软件执行操作等)?
- 他们是否遵循特定的导航模式?
- 我看到了一些对 favicon.ico 的请求?这是否暗示它是自动浏览?
我发现这篇文章有一些有价值的观点。