问题标签 [fast-vector-highlighter]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1059 浏览

lucene - FastVectorHighlighter.Net 在 GetBestFragment 上返回 null

我有一个大索引,Highlighter.Net 在该索引上工作正常,但 FastVectorHighlighter 在某些文档上返回 null 作为最佳片段。

搜索器工作正常。它只是荧光笔。该字段已为所有文档以相同的方式编入索引,所以我不明白为什么它会突出显示某些文档而不是全部。

使用从主干 rev942061 构建的 Lucene.Net 2.9.2

0 投票
3 回答
667 浏览

lucene - 从 FastVectorHighlighter 中的 GetBestFragment 返回整个字段

在 Highlighter.Net 中,我们可以使用 NullFragmenter 来返回整个字段内容。有什么方法可以在 FastVectorHighlighter.Net 中做到这一点?

0 投票
1 回答
429 浏览

lucene - 带有外部数据库的 FastVectorhighlighter

我在我的一个项目中使用 Lucene.NET 2.9。我正在使用 Lucene 为文档创建索引并搜索这些文档。我文档中的一个字段包含大量文本,我已将其存储到我的 MS SQL 数据库中。所以基本上我通过 lucene 搜索它的索引,然后从 MS SQL 数据库中获取完整的文档。

我面临的问题是我想在结果中突出显示我的搜索查询词。为此,我正在使用 FastVectorHighlighter。现在这个特殊的荧光笔需要 Lucence DocId 和字段来突出显示字段。问题是这个特殊的文本重字段因为没有存储在 lucene 数据库中,所以在我的搜索结果中没有突出显示。

关于如何完成相同任务的任何建议。我要么将相同的字段添加到我的 lucene 数据库中。它将解决问题,但会使我的数据库非常繁重。其次,如果有一些替代方法来突出显示文本,它将给我很大的灵活性。

感谢您阅读问题,纳文

0 投票
1 回答
733 浏览

java - FastVectorHighlighter 短语突出显示不适用于词干

尝试编写词干分析器来存储词干和原始单词会导致使用FastVectorHighlighter.

输入字符串是foo bar bazba词干bar。下图说明了分析

在此处输入图像描述

短语搜索产生匹配但根本没有突出显示

hl.bs.type=WORD用在哪里boundayScanner

这两种方法hl.useFastVectorHighlighter=false和查询中的引用都会突出显示所有术语。

Solr 3.6.2正在使用,该字段定义如下

并分析为

0 投票
1 回答
253 浏览

lucene - Lucene MultiFieldQueryParser 和 Highlighter

我正在通过不同的字段索引 lucene 索引中的文章,即title, description, link,publishDate

我使用MultiFieldQueryParser查询索引,例如

然后我将文章显示为搜索结果。到目前为止一切都很好。现在我想突出显示标题中的搜索文本,描述

我该怎么办?正常的荧光笔在生成片段时会给我NullPointerException 。PostingHighlighter了我一个Map根据字段组合在一起的结果..但我不希望这样。I 是要返回的整个文档,同时突出显示标题和描述中的搜索文本。

任何帮助或建议或代码片段表示赞赏..

0 投票
0 回答
306 浏览

elasticsearch - Elastic Search FVH 突出显示最小匹配令牌

设置:

映射:

询问:

我有用 TITLE 索引的文档,吃点开心的饭。当我搜索有一些时,我能够得到适当的亮点。

当我输入更多有一些 ha时,突出显示的结果并不像预期的那样。

have单词部分突出显示为ha

我希望它突出显示最长的匹配标记,因为对于最小大小 = 1 的 ngram,这给了我 1 个或更多字符的突出显示,而应该有另一个匹配的 4 或 5 个字符的标记(例如:应该与ha一起突出显示。

我无法找到任何解决方案。请建议。

0 投票
0 回答
78 浏览

highlight - 带有细粒度中文分割工具的 Lucene.Net FastVectorHighlighter 不起作用

在此处输入图像描述

错误是:

这是因为资源代码:

细粒度分词高亮用这段代码会出错。因为这个功能可能要求分词是连续的。而细粒度分词是不连续的。我想问一下 FastVectorHighlighter 如何用细粒度的分词突出显示。

0 投票
1 回答
2178 浏览

elasticsearch - 返回 Elasticsearch 中搜索查询的位置和突出显示

我正在使用安装在个人 Debian 服务器上的官方 Elasticsearch-PHP 客户端,我正在尝试做的事情包括索引、搜索和突出显示单个文档。即每个搜索结果将只返回一个文档 - 然后将突出显示“简单查询字符串”搜索。我也在使用 FVH(快速矢量突出显示)。

我的问题和这个Position 结果类似,不是高亮,而且测试代码基本相同,这里不再赘述。但是在我的情况下,我需要定位和突出显示我点击了有关术语向量的文档的链接,但就像其他 OP 一样,我的搜索本身并不是确切的单词。在某些情况下,它们是短语。我将如何处理这个?

我的用例是只搜索一个文档(对于每个查询),并显示带有链接的结果摘要,用户可以单击这些链接转到文档中该结果来自的特定位置。如果我有索引/位置,我可以简单地将它用于文档的完整来源。我检查了文档无济于事。