ruby-on-rails-3 - Rails：检测机器人 IP 以绕过缩短 ping

Question

我有一个记录用户点击的应用程序。问题是，这些点击是通过 Twitter 推送的，这缩短了与 t.co 的每个链接。正因为如此，Twitter 似乎从不同的 IP 中点击了 7-15 次之间的链接，可能是为了做日志记录和垃圾邮件保护之类的事情。问题是这会在我的应用程序上记录 7 到 15 次“点击”，而不是来自实际用户。

我想知道是否有一种方法可以检测访问是来自实际用户还是只是被 cURL 或来自机器人或蜘蛛的某种东西。

似乎可行的一种方法是使用http://www.projecthoneypot.org/的 API 来查看访问我网站的 IP 是否来自已知机器人。我找到了一个可以提供帮助的 gem (http://cl.ly/GlT8)，但在尝试使用它时不断收到 NET DNS 错误。

我的想法很新鲜。非常感谢任何帮助！

score 1 · Accepted Answer

Twitter 应User-Agent:正确设置其 http 标头，以便您可以将其过滤掉。这当然可以伪造，但这是一个开始。

您可以使用request.headers["User-Agent"].

ruby-on-rails-3 - Rails：检测机器人 IP 以绕过缩短 ping

1 回答 1

Related

Reference