1

我已将大型 pdf 文件索引到弹性搜索引擎中。我已经用雪球分析器分析了这个非结构化数据。这将使用雪球过滤器将“跑步”等单词转换为“跑步”。但是如果我想准确搜索“跑步”这个词怎么办?这对我没有帮助。

我不能去使用另一个字段,因为这些是更大的文件,并且可以在更大程度上增加索引大小。

那么如何使用雪球过滤器来使用“preserver_original”之类的东西。这样我就可以将原始单词与词干单词一起保留。

有什么方法或替代方法可以根据我的要求分析该领域吗?

4

1 回答 1

1

您可以使用“原位提取”: https ://www.elastic.co/guide/en/elasticsearch/guide/current/stemming-in-situ.html

于 2016-09-01T19:32:28.777 回答