我有一个人们可以发布文本的网站。每个帖子都存储在一个数据库中,其中包含发布者的 ip 和发布时间。如果我能确定海报是机器人、垃圾邮件发送者等,我希望能够显示一个recaptcha。
什么是一个好的算法来做到这一点?最简单的选择是分析预定时间段内的帖子数量,比如一分钟,是否大于选择的限制,比如 10。但是,这有一个缺陷是多个人从同一个 ip 后面发帖,甚至是创建随机频率间隔>该时间段的机器人,或发布少于该时间段限制的帖子。
显然没有“正确”的答案。然而,有些算法比其他算法更好,我只是想找到最好的算法。