我正在托管一个聊天网站,并在其中放置了一个 java 脚本来阻止垃圾邮件。如果有人发布相同的句子或单词,它不会发布第二个。我最近注意到有人使用不同的垃圾邮件技术,说同一个词,但在词尾加上数字会增加。例如像这样:Spam、Spam1、Spam2、Spam3 等等。因此,如果你们中的任何人知道代码是什么或他如何编写脚本,我将不胜感激,因为我不确定脚本是什么。
问问题
1435 次
1 回答
0
我认为您最好的选择是在提交的帖子/单词之间进行更一般的比较。这很可能是一个自定义脚本,并且尝试专门针对个别技术将允许他们不断进行细微调整以绕过您的对策。这可以使用两个字符串的Levenshtein 距离来完成。仅添加一个数字会导致帖子与原始帖子之间的 Levenshtein 距离非常短,因此您可以忽略与以前的提交内容过于相似的提交内容。您可以使用许多服务器端库来完成这项工作,但如果不知道您是如何运行网站的,我真的不能推荐任何东西。
于 2012-09-24T22:30:01.340 回答