去年,我正在开展一个圣诞节项目,该项目允许客户相互发送电子邮件,其中包含 256 个字符的自由文本字段,用于他们的圣诞节请求。该项目通过在(非常大的)产品数据库中搜索与文本字段匹配的建议产品来工作,但为那些无法找到相关产品的客户提供免费文本选项。
一个明显的担忧是客户有机会向一些毫无戒心的客户发送相当明确的请求,而公司的品牌就围绕在它周围。
由于各种原因,该项目最终没有进行,其中之一是亵渎。
然而,我回过头来思考这个项目,想知道这里可以使用哪些类型的验证。我知道clbuttic我知道这是对这种性质的任何问题的标准回答。
我考虑的解决方案是:
- 通过 WebPurify 之类的东西运行它
- 使用 MechanicalTurk
- 编写一个在列表中查找单词的正则表达式模式。一个更复杂的版本也会考虑这个词的复数和过去时。
- 写出一系列可疑的单词,并为每个单词打分。如果提交超过分数,则验证失败。
所以有两个问题:
- 如果提交失败,从UI角度如何处理?
- 这些解决方案或您可以建议的任何其他解决方案的优缺点是什么?
注意 - 像“亵渎过滤器是邪恶的”这样的答案是无关紧要的。在这种半假设的情况下,我还没有决定实施脏话过滤器,也没有决定是否实施。我只需要用我的编程技能做到最好(如果可能的话,应该在 LAMP 堆栈上)。