问题标签 [lucene-highlighter]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1391 浏览

lucene - pom.xml.template 是否告诉我将项目用作依赖项所需知道的一切

我正在尝试将名为term-highlighter的 lucene 沙箱贡献添加到我的 pom.xml 中。我对 Maven 不是很熟悉,但是代码有一个pom.xml.template,这似乎暗示我是否添加了一个如下所示的依赖项:

它可能会起作用。有人可以帮我在我的 pom.xml 文件中添加一个 lucene-community 项目吗?

感谢您的评论,事实证明添加版本是我所需要的,我只是猜测它应该与我使用的 lucene-core 版本匹配。:

0 投票
2 回答
275 浏览

.net - 获取搜索字段中突出显示的片段的开始和结束索引

“我的搜索从一个字段返回一个突出显示的片段。我想知道在特定搜索文档的那个字段中,该片段在哪里开始和结束?”

例如。

考虑我在上面的行中搜索“突出显示的片段”(将上面的段落视为单个文档)。

我将我的碎片设置为:

现在GetBestFragment的输出有点像:“从”返回一个突出显示的片段

是否可以在上面的文本中获取此片段的开始和结束索引(比如开始是 10,结束是 45)

0 投票
1 回答
1487 浏览

lucene - 使用 Lucene 荧光笔的问题

我正在为我的应用程序使用 Lucene Highlighter 2.4.1。我使用荧光笔来获得最匹配的片段,并显示它们。我调用了一个函数 String[] getFragmentsWithHighlightedTerms(Analyzer analyzer, Query query, String fieldName, String fieldContents, int fragmentNumber, int fragmentSize)。例如 :

函数 getFragmentsWithHighlightedTerms() 定义如下

现在我的问题是 highlighter.getBestFragments() 方法正在返回重复项。即,如果我显示说前 5 个片段,则不。1和3是一样的。我不太明白是什么原因造成的。代码有问题吗?

0 投票
1 回答
983 浏览

parsing - 将 Lucene Highlighter 与 MultiFieldQueryParser 一起使用

我使用 Lucene Highlighter 突出显示我在 Lucene 索引中找到的匹配项。现在,我的问题是,如果我必须搜索一个文档的多个字段,并且我需要显示匹配的文本,那么我怎样才能获得命中发生在哪个字段中?

我用于荧光笔的代码基本上是这里的第二个功能

如果我不知道命中发生在哪个字段中,那么我应该将哪个字段传递给上面定义的函数以获取匹配的片段?

0 投票
1 回答
830 浏览

lucene.net - Lucene.NET 荧光笔插件奇怪地突出显示

我正在尝试将 Lucene.NET Highlighter 添加到我的搜索中,但是它做了一些非常奇怪的突出显示,我做错了什么?

下面是高亮代码:

搜索给"lorem"了我这个 bestFragment 值:

如您所见,它突出显示的不仅仅是"Lorem". 为什么?

我如何使这个行为明智?

我正在使用 aStandardAnalyzer我的查询看起来像"content:lorem"

*编辑:*我使用 Lucene.NET 2.9.2

谢谢

0 投票
1 回答
1464 浏览

lucene - Lucene 实体提取

给定实体术语的有限字典,我正在寻找一种使用 Lucene 进行智能标记的实体提取方法。目前我已经能够将 Lucene 用于:
- 搜索具有一些模糊性的复杂短语
- 突出显示结果

但是,我不知道如何:
- 获得匹配短语的准确偏移量
- 每次匹配执行特定于实体的注释(不仅仅是每次点击的标签)

我尝试过使用 explain() 方法——但这只会给出查询中获得命中的术语——而不是原始文本中命中的偏移量。

有没有人遇到过类似的问题并愿意分享潜在的解决方案?

提前感谢您的帮助!

0 投票
2 回答
1486 浏览

java - Solr WordDelimiterFilter + Lucene 荧光笔

我试图让来自 Lucene 的 Highlighter 类与来自 Solr 的 WordDelimiterFilter 的标记一起正常工作。它在 90% 的情况下都有效,但如果匹配文本包含“,”,例如“1,500”,则输出不正确:

预期:'测试1,500这个'

观察到:'测试 1 1,500这个'

我目前不确定是荧光笔弄乱了重组还是 WordDelimiterFilter 弄乱了标记化,但有些不开心。以下是我的 pom 中的相关依赖项:

org.apache.lucene lucene-core 2.9.3 jar 编译 org.apache.lucene lucene-highlighter 2.9.3 jar 编译 org.apache.solr solr-core 1.4.0 jar 编译

这是一个简单的 JUnit 测试类来演示这个问题:

有人有什么想法或建议吗?

0 投票
2 回答
1155 浏览

lucene - Lucene Fast Vector Highlightor 片段

我是 Lucene 的新手。有没有办法让 Lucene FVH 返回以搜索查询为中心的片段/片段,而不是大约从搜索查询开始?另外,有没有办法告诉 FVH 分片器只在换行符处分片?谢谢!

0 投票
1 回答
1533 浏览

lucene - 如何在短语查询中使用 Lucene 荧光笔?

如何将 Lucene 的荧光笔与短语查询一起使用?
我做了一个谷歌搜索,我对 spanScorer、QueryScorer 和类似的东西感到困惑..

我使用的 Lucene 版本是 3.0.3

我的要求是
- 进行多字段查询
- 进行通配符搜索
- 进行短语查询

以上所有内容都需要突出显示。
我该如何做到这一点?

0 投票
1 回答
184 浏览

lucene - KWIC 与 lucene 3.1

我研究了Lucene,但有些东西我还是不明白。首先,我使用 lucene 的最新版本 3.1。

然后一切正常,但我一直无法使用荧光笔和碎片。

有人知道如何在最新版本中使用它吗?

谢谢你,对不起我的英语......