7

我目前正在尝试为我的网站开发基本的全文搜索,并且我注意到某些单词(例如“关于”)被列为 MySQL 全文搜索的停用词。现在这并没有让我太困扰,因为搜索给定新闻项目的人不一定会使用“关于”这个词进行搜索(但我当然不能代表所有人!)。然而,我希望这里有人能启发我关于有一个停用词列表的理由。谢谢!

澄清: 我在全文表格中使用 MyIsam。停用词是 MySQL 不会索引的词(对于任何全文索引)。正如对该问题的评论中所述,有一个完整的停用词列表,没有任何解释。我只是想知道“他们”选择的词背后是否有理由。

4

1 回答 1

8

停用词只是英语中的常用词。在大多数情况下,如果您不为这些词编制索引,您的搜索结果会更相关 - 并且您的索引会更小更快。

如果更适合您的需要,您可以使用 ft_stopword_file 变量编辑停用词列表(或将其设置为 '' 以索引与 ft_min_word_len 一样长或更长的所有单词)。您还可以使用 ft_min_word_len 变量更改最小索引字长,该变量存在的原因相同。

于 2010-02-23T19:35:05.210 回答