0

我有一个 mysql 表,其中包含一个多语言坏词的大列表(大约 5000 个单词)。我需要找到一种有效的方法来过滤掉用户创建的短信中的亵渎词。在我看来,使用 php regex 并不合适,因为坏词列表很大。

此外,将消息分成单词然后查询每个单词是一种解决方案,这对于用户发布大量消息的高流量站点来说是可怕的。我需要一个优化的解决方案,因为许多用户将同时使用此服务。

有什么建议么?或者如果你认为正则表达式是合适的,那么你能解释一下cpu/内存使用和执行时间方面的可行性吗?

4

0 回答 0