问题标签 [lucene-highlighter]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1084 浏览

zend-framework - Symfony 和 Zend Lucene 突出显示

我使用 symfony 1.4,并使用 Zend Lucene 搜索,就像在Jobbet中一样,我需要突出显示搜索结果,我读过 这个,但我不明白它在我的 symfony 案例中是如何产生的(

$sourceHTML 是什么?这一切都只靠一排吗?

更新:

它适用于我的模型,但它如何在我看来实现?

0 投票
1 回答
2471 浏览

solr - Lucene 中短语查询的位置偏移

我正在定制荧光笔插件(使用 FVH)以输出给定搜索的查询词的位置偏移量。到目前为止,我已经能够使用下面的代码提取正常查询的偏移信息。但是,对于 Phrase 查询,即使它不是 Phrase 查询的一部分,代码也会返回所有查询术语(即 termSet)的位置偏移量。因此,我想知道 Lucene 中是否有一种方法可以仅获取使用 FVH 进行短语查询的匹配短语的偏移量信息?

电流输出:

预期输出:

我要强调的字段有termVectors="true"termPositions="true"termOffsets="true"并且正在使用 Lucene 3.1.0。

0 投票
1 回答
132 浏览

lucene - Lucene 将 2 个字段值作为单个搜索

Lucene 文档具有acontenthelloawith content字段world。如果我要搜索"hello world"~2它将被建立=(。我该如何修复它?
FastVectorHighlighter将突出显示它<b>helloworld</b>(没有任何空格)(无论如何它不应该突出显示它)

0 投票
1 回答
550 浏览

java - Lucene 荧光笔不匹配前缀

我正在使用 Lucene 的荧光笔来突出显示字符串的某些部分。下面的代码似乎可以很好地查找词干,但不适用于前缀匹配。

我已经阅读了几个不同的地方,我需要调用 Query.rewrite 才能使前缀匹配工作。该方法虽然需要 IndexReader 争论,但我不确定如何获得它。我发现调用 Query.rewreite 的所有示例都没有显示 IndexReader 的来源。我要补充一点,这是我正在使用的唯一 Lucene 代码。我没有使用 Lucene 来进行搜索,只是为了突出显示。

我如何创建一个 IndexReader,如果我按照我的方式使用 Lucene,是否可以创建一个。或者也许有一种不同的方法可以让它突出显示前缀匹配?我对 Lucene 很陌生,我确定所有这些部分都做了什么,或者它们是否都是必要的。我刚刚从网上找到的各种示例中复制了它们。所以如果我做错了什么,请告诉我。谢谢。

0 投票
1 回答
200 浏览

fonts - Lucene 和高亮文本字体问题

我使用 Lucene HighLighter,成功了。这是我的代码:

问题出在我的搜索结果/突出显示的文本上,字符是乱码。这是因为缺少字体吗?

这是我的突出显示文本:

注意时髦的文字!

任何帮助将不胜感激。

0 投票
3 回答
2251 浏览

java - 突出显示包含 HTML 的字段

我有一个可能包含 HTML 代码作为用户输入的字段。如果我使用简单的荧光笔,它不会在添加<em>标签之前转义输入。例如,如果输入是

我搜索“标题”,我得到:

但我想得到:

当呈现为 HTML 时,它看起来与突出显示匹配单词的输入相同。

0 投票
0 回答
446 浏览

solr - 突出显示 Solr 中引用的查询的问题 - 未返回片段

这很好奇。突出显示在所有其他情况下都可以正常工作,但在这种情况下它不会返回任何片段。我的文档如下(fieldType text_en):

Abu Yahya Suhaib bin Sinan(愿真主喜悦他)报告说:真主的使者(PBUH)说:“信士的情况是多么美妙;他的一切都是好事,这仅适用于信士。如果顺境降临,他向真主表示感谢,这对他有好处;如果逆境降临在他身上,他会耐心地忍受,这对他更好”。[穆斯林]。

我的查询是

Solr 找到文档返回正常,但是返回值的高亮部分不包含文档的文本。它有一个文档主键字段(像往常一样),但没有比这更深的了。

如果我删除最后一个词,一切正常。如果我从引号中删除最后一个单词并将其放在外面,它会起作用。它甚至可以在引号中使用更长(不同)的字符串。它只是不适合这个!

我该如何开始调试呢?

我在 schema.xml 中没有任何突出显示设置,这里是我作为查询的一部分传递的参数:&hl=true&hl.fl=hadithText&hl.snippets=50&hl.fragsize=2500&hl.mergeContiguous=true&defType=edismax&mm=3 <-1%205<-2&hl.usePhraseHighlighter=true

0 投票
3 回答
605 浏览

lucene.net - 为什么缺少定义?Lucene.Net 3.0.3 - 快速矢量荧光笔

作为 Lucene.Net/Lucene 和 C# 的新手,我能够输入几行代码并运行搜索。

现在我想取回找到的区域的片段。我找到了下面的代码,但 Visual Studio 一直告诉我 a)“Searcher 确实包含 getIndexReader 的定义”和 b)“ScoreDoc 不包含 doc 的定义”——我不明白问题所在!

有没有人可以提供帮助。

我在 Visual Studio 2010 Express 上使用 Lucene.Net 3.0.3 和 Lucene Contrib 3.0.3。

请参阅下面的代码。

谢谢你的帮助!

钢筋混凝土


0 投票
2 回答
10464 浏览

java - Lucene 荧光笔

Lucene 4.3.1 荧光笔是如何工作的?我想从文档中打印出搜索结果(作为搜索词和该词之后的 8 个词)。我怎样才能使用 Highlighter 类来做到这一点?我已将完整的 txt、html 和 xml 文档添加到文件中,并将它们添加到我的索引中,现在我有了一个搜索公式,我可能会从中添加荧光笔功能:

}

0 投票
1 回答
53 浏览

lucene - 如何在 Lucene 上搜索的每个文档只允许一个查找

我只希望我的 Lucene 搜索为每个文档提供得分最高的突出显示片段。所以假设我有 5 个文档,每个文档都写了 3 次“性能”一词,我仍然只希望打印 5 个结果并在结果页面上突出显示。我该怎么做呢?谢谢!