0

我正在寻找机器人检测的想法。我不介意机器人抓取我的网站,这很酷,问题在于他们何时开始发布内容。我最近因为这样的坏男孩不得不删除 400 个帐户。那么我的选择是什么?

验证码不是一个真正的选择,我们不再生活在 1990 年。我发现另一种看起来很有趣的方法是已知机器人的数据库,以及在用户代理字符串中搜索机器人蜘蛛爬虫等,这似乎很有希望,但是由于显而易见的原因,我不喜欢硬编码名称部分我想那也行不通。

我正在寻找不需要更新的东西,并且在时间结束之前几乎可以工作。我的想法是创建一个 check-for-bot 方法,该方法将在所有帖子(插入表中的 POST 请求)上调用,并记录帖子的时间和用户/机器人的 IP 以及只要存在记录的时间创建时间将与当前时间和类似的东西进行比较,但这也会失败,因为有些网络使用相同的 IP 并且可能会在那里导致问题,尤其是 wifi,你知道现在的情况。

有没有人有任何想法,可能与我的相似,甚至更好?我真的需要阻止那些机器人继续在我的网站上发布东西,但我也需要它是一种简洁的方式。

感谢您花时间阅读本文,即使您无法帮助我!

4

1 回答 1

2

您是否尝试过添加一个显示在屏幕外的输入字段,以便普通用户永远不会填写它。大多数机器人会尝试填写似乎相关的每个字段,因此如果填写了该隐藏字段,请忽略该帖子。

于 2013-06-07T16:04:47.490 回答