2

我有一个记录用户点击的应用程序。问题是,这些点击是通过 Twitter 推送的,这缩短了与 t.co 的每个链接。正因为如此,Twitter 似乎从不同的 IP 中点击了 7-15 次之间的链接,可能是为了做日志记录和垃圾邮件保护之类的事情。问题是这会在我的应用程序上记录 7 到 15 次“点击”,而不是来自实际用户。

我想知道是否有一种方法可以检测访问是来自实际用户还是只是被 cURL 或来自机器人或蜘蛛的某种东西。

似乎可行的一种方法是使用http://www.projecthoneypot.org/的 API 来查看访问我网站的 IP 是否来自已知机器人。我找到了一个可以提供帮助的 gem (http://cl.ly/GlT8),但在尝试使用它时不断收到 NET DNS 错误。

我的想法很新鲜。非常感谢任何帮助!

4

1 回答 1

1

Twitter 应User-Agent:正确设置其 http 标头,以便您可以将其过滤掉。这当然可以伪造,但这是一个开始。

您可以使用request.headers["User-Agent"].

于 2012-05-20T00:37:08.897 回答