志同道合的人如何应对过滤亵渎的基本挑战,显然不可能解决所有情况,但最好有一个最基本的级别作为第一道防线。
在 Obj-c 我有
NSString *tokens = [text componentsSeparatedByString:@" "];
然后我遍历每个标记以查看是否在每个标记中找到任何关键字(我在列表中有大约 400 个)。
实现误报也是一个问题,如果单词是完美匹配,则将其标记为亵渎,否则如果发现超过 3 个带有亵渎的单词但未完全匹配,则它也被标记为亵渎。
稍后我将使用一个更精确地解决问题的网络服务,但我真的只需要一些基本的东西。所以如果你写了阴茎这个词,它会变得顽皮顽皮,写得不好。