我们想在我们的 html 主体中设置一个小蜜罐图像来检测爬虫/恶意机器人。
以前有没有人设置过这样的东西?
我们认为最好的方法是:
a) 通过以下方式将 html 注释掉:
<!-- <img src="http://www.domain.com/honeypot.gif"/> -->
b) 将 css 样式应用于图像,使其通过以下方式隐藏在浏览器中:
.... id="honeypot" ....
#honeypot{
display:none;
visibility:hidden;
}
使用上述内容是否有人预见到适当和真实的用户代理会拉取图像/尝试渲染它的任何情况?
honeypot.gif 将是一个 mod_rewritten 的 php 脚本,我们将在其中进行日志记录。
虽然我知道上述两个条件可能会被任何编码良好的爬虫跳过,但它至少可以对非常肮脏的情况有所了解。
关于最佳方法的任何其他指示?