我正在搜索服务/策略以检测表单中输入的名称何时是垃圾邮件,例如:asdasdasd、ksfhaiodsfh、wpoeiruopwieru、zcpoiqwqwea。疯狂的键盘输入。
我正在尝试 akismet 不是专门用于名称(http://kemayo.wordpress.com/2005/12/02/akismet-py/)。
提前致谢。
一种策略是使用带有奇怪名称的黑名单和/或带有正常名称的白名单来拒绝/接受名称。但可能很难找到它。
您可以寻找不寻常的字符组合,例如许多连续的元音/辅音,并查看您的注册并创建一个以假名重复出现的模式(如 asd)列表
我会避免自动阻止这些输入,而是将它们标记为检查
要求一个真实的电子邮件并发送信息以在那里连接。然后从帐户中获取信息。
无论如何,没有任何方法是真正安全的。
如果速度不是问题,请下载前 100k 最常用名称的列表,将它们放入 O(1) 查找数据结构中,查看输入是否存在,如果没有,您始终可以将输入与使用字符串相似度算法的条目。尽管如果这样做,您可能希望按起始字母进行存储,以防止必须对整个列表执行该计算。