Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我已将大型 pdf 文件索引到弹性搜索引擎中。我已经用雪球分析器分析了这个非结构化数据。这将使用雪球过滤器将“跑步”等单词转换为“跑步”。但是如果我想准确搜索“跑步”这个词怎么办?这对我没有帮助。
我不能去使用另一个字段,因为这些是更大的文件,并且可以在更大程度上增加索引大小。
那么如何使用雪球过滤器来使用“preserver_original”之类的东西。这样我就可以将原始单词与词干单词一起保留。
有什么方法或替代方法可以根据我的要求分析该领域吗?
您可以使用“原位提取”: https ://www.elastic.co/guide/en/elasticsearch/guide/current/stemming-in-situ.html