我的搜索引擎需要一种方法来处理搜索字符串中的小错别字并仍然返回正确的结果。
根据 ElasticSearch 文档,在文本查询中存在与模糊匹配相关的三个值:fuzziness、max_expansions和prefix_length。
不幸的是,没有太多关于这些参数的确切作用以及它们的合理值的详细信息。我确实知道模糊度应该是 0 到 1.0 之间的浮点数,而另外两个是整数。
任何人都可以为这些参数推荐合理的“起点”值吗?我确信我将不得不通过反复试验进行调整,但我只是在寻找能够正确处理错别字和拼写错误的大致值。