3

我想了解在使用 nGram 标记器时对 max_gram 使用较大设置的含义。我知道它会爆炸索引的大小,但是然后呢?它会使搜索变慢吗?它会导致事情出错吗?ETC

4

1 回答 1

1

它肯定会使搜索变慢,因为会生成很多标记进行比较。

一般来说,您应该分析您的业务并找出适合您领域的 ngram 大小。例如:对于产品 ID,您可以支持搜索 ngram 最多 20 个字符(max_gram=20),因为通常人们只记得产品 ID 的 5 或 6 个字符,20 就足够了。

于 2013-09-20T07:37:18.690 回答