我现在正在做我网站的管理控制部分,并想添加一个功能,允许管理员控制评论,即粗话。是否可以仅针对行政检查显示令人反感的评论?有没有适合这个的PHP函数?
问问题
67 次
1 回答
0
我有机会为 cricket.yahoo.com 上的聊天小部件开发了一个幼稚的亵渎过滤器(您可以想象球迷在比赛进行时在聊天中互相诅咒,这对雅虎的声誉来说是非常不可接受的)。
想法非常简单,只要您有一个要过滤的单词列表。我有一份来自各种口语的大约 10 万个亵渎词的列表。想法是有一个 O(1) 查找来检查一个单词是否是亵渎的。
即使亵渎单词列表仅包含“fuck”,也可以捕获诸如“fuuuucccckkkk”之类的情况,可以使用soundex(和相关)类算法。这是通过预先构建和缓存特定数据结构(在memcache中)来完成的。
收到评论后,以下过程如下:
- 从 memcache 加载预先计算的数据结构
- 对评论中的每个单词执行查找
- 在数据结构中查找一个词(相似词)是 O(1)
缓存数据结构是 soundex、djb2和其他一些算法的混合体
于 2012-04-19T11:16:13.173 回答