问题标签 [elasticsearch-analyzers]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 用于文本分析的 Elasticsearch 分析器
我是 Elasticsearch 的新手,愿意使用全文搜索引擎。对于文本分析,我需要使用(多语言)语言分析器。Elasticsearch 提供内置的语言分析器,但我不确定它们是否涵盖预处理步骤,例如:删除停用词、词干提取、删除不需要的字符等。我将使用多字段,因为所有(描述)语言都在同一个字段中进行索引在一个文件中。在这种情况下,这样的映射是否正确?
我很困惑如何使用语言分析器来分析输入文本以及我们何时使用映射而不是设置?
elasticsearch - Searchkick 词干提取
使用 searchkick 并查看搜索"animals"
返回的结果是"anime"
因为它们的 stem "anim"
。有人对如何改善这些结果有任何建议吗?
我在文档中看到你可以做类似的事情
但是,为所有像这样的坏人保留一份运行列表似乎需要做很多工作。
想知道我是否需要更换词干分析器?
elasticsearch - elasticsearch中带有标记器“模式”的“asciifolding”
谁能告诉我为什么“asciifolding”在我下面的映射中的“模式”标记器上不起作用?
我需要使用“模式”标记器,但我也不需要区分带有重音或没有“asciifolding”所做的重音功能的单词。
我需要“televisão”等于“televisao”,但“asciifolding”不适用于具有“asciifolding”和标记器“模式”的“analyzer_customizado”
有人可以告诉我如何修复我的“asciifolding”映射以在具有标记器“模式”的“analyzer_customizado”中工作
elasticsearch - 在弹性搜索中进行搜索查询时如何忽略双斜杠?
例如,在弹性搜索文档中,字符串存储为 \\(\\log_4(3x^2+11x)=1\\) 我想让它工作的搜索查询是 (log_4(3x^2+ 11x)=1)。
完成这项工作的最佳方法是什么?
elasticsearch - 如何将分析器添加到弹性搜索弹簧数据中的嵌套字段?
我有实际上包含嵌套类型的架构,如下所示。
这是主要模式。
现在,Promotion 是主模式中的另一个实体。所以我把它标记为嵌套类型。在 Promotion 实体中,我正在尝试添加分析器,如下所示
这是我的 elastic-analyzer.json
当我喜欢时,根本不会在 Elasticsearch 中创建完整的映射。它只是创建如下所示
所以我的问题是如何在嵌套类型中添加分析器。任何帮助,将不胜感激。
elasticsearch - 在数组类型的 ElasticSearch 字段中添加分析器
我有一个弹性搜索对象,其中一个字段是数组类型。现在我想应用与标准默认分析器不同的分析器。当我在索引定义中传递分析器时,它会抛出错误。我怎样才能做到这一点?
在下面的示例中,技能包含一个值数组。我想要的只是应用不同的分析器并查看结果。我怎样才能做到这一点?
出现以下错误:
elasticsearch - 在 Elasticsearch 的一个映射中使用带有 ngram Analyzer 的不同语言分析器
我想将英语和德语自定义分析器与其他分析器(例如 ngram)一起使用。以下映射是否正确?我收到德国分析仪的错误。[未知设置 [index.filter.german_stop.type]。我进行了搜索,但没有找到有关在自定义类型中使用多种语言分析器的任何信息。是否可以使用特定于语言的 ngram-filter?
java - 如何更新标准分词器的令牌
我在我的弹性搜索插件中使用标准标记器。我需要迭代标准标记器的每个标记,并用一些加密文本更新到 lucene 索引。有没有办法更新标准分词器的令牌?任何人都可以帮忙吗?
php - elasticsearch php不返回没有空格的搜索结果
我在 elasticsearch indexproducts_idx1
和 type中添加了 15k 条记录product
。
在记录产品名称apple iphone 6
时,当我搜索iphone6
它时,它会返回空数据。
这是我在 php elasticsearch 中的代码
elasticsearch - 带有短语建议的拼写错误建议(“您的意思是”)和 Elasticsearch 的空格校正
我使用默认分析器“英语”来搜索文档,它非常好。但是,当搜索查询拼写错误或通过此类拼写错误的短语进行搜索时,我还需要“您的意思是”结果。
我需要什么分析器/过滤器/查询来实现这种行为?
源文本
搜索词
搜索查询 => 你的意思是 XXX 吗?
遗漏的字母或类似
Elastisearch => Elasti c search
distrib a ted => 分布式
Apac j e => Apache
额外空间
弹性搜索 => 弹性搜索
没有空间
开源 => 开源
拼写错误的短语
serach engne => 搜索引擎