问题标签 [solr-highlight]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
297 浏览

solr - 突出显示不起作用:HighlightComponent.process() 第 139 行中的 NullPointerException

尝试在 Solr 4.7.2 中进行简单的突出显示。我正在构建示例中提供的标准 solrconfig.xml。我已经修改了/select请求处理程序,如下所示:

但是当我执行搜索时,我得到一个 NPE:

如果我<str>highlight</str>从 solrconfig.xml 中删除,则查询有效。我正在执行的查询是:

0 投票
1 回答
656 浏览

solr - SOLR-高亮搜索文本?这可能吗

我从 SOLR 开始,所以如果这个问题是愚蠢的或类似的问题,请不要激怒我。我正在阅读 solr 文档,发现有一个叫做“highlight”的东西。我有非常简单的查询:

text 是我的索引中的一个字段,我试图突出显示此查询仅突出显示第一次命中的所有结果:

我做错了什么?是否有任何可能性,例如在高亮显示后削减 50 个字符,并且不仅突出显示第一次点击

0 投票
1 回答
138 浏览

solr - 使用 PostingsSolrHighlighter 进行自定义

我正在使用带有默认参数的 PostingsSolrHighlighter,它似乎给出了很好的结果。我的用例是针对完整文档搜索文本段落并获取相关片段,这个荧光笔确实提供了匹配文档中最接近的段落。

我需要的自定义是删除似乎与搜索的段落无关的浪费片段。目前,我正在寻找一种简单的方法:删除相对分数为 0.5 或更低的片段。但是我找不到一种方法来获得 Solr 为句子/片段计算的分数,所以我可以丢弃不太需要的分数。

我可以告诉 solr 仅在其分数大于 xyz 分数时才保留片段,或者它可以以某种方式给我片段分数吗?

我仍然想保持结果片段的顺序(根据原始文档中片段的起始位置)。

谢谢。

0 投票
2 回答
180 浏览

solr - Solr 突出显示外部字段

我想使用 Solr 突出显示,但我们的文档仅被索引而不是存储。字段值可在单独的数据库中找到。有没有办法传入要突出显示的文本,而 Solr 不需要从其自己的存储字段中提取该文本?或者是否有一个接口可以让我传入查询、字段名称、字段值并取回片段?

我在 Solr 5.1 上。

0 投票
1 回答
350 浏览

solr - 在 solr 中突出显示查询词的匹配文本

我安装了 solr jetty 5.1.3,并使用 tika 索引了超过 15000 个文档。我已经在 SOLR 中索引并存储了文档发布日期和内容。我在 solrConfig.xml 中启用了突出显示,这是突出显示术语的请求处理程序的 xml

它最多返回三个亮点,搜索文本为粗体。就像我在查询词中搜索“Lorem”一样,它会向我返回一个类似的亮点

Lorem ipsum dolor sit amet 2016, consectetur adipiscing elit。sed volutpat metus lorem,一个placerat nibh sodales in。在mauris tempus,vulputate felis eu,tincidunt erat 中的Cras。

但是当我搜索发布日期在过去 1 年到现在之间的文档时,它突出显示了两个术语。例如,如果我搜索““Lorem”和 docPublishDate:[2015-01-20 TO 2016-01-20]”,那么它会向我返回类似这样的亮点:

Lorem ipsum dolor sit amet 2016 , consectetur adipiscing elit。sed volutpat metus lorem,一个placerat nibh sodales in。在mauris tempus,vulputate felis eu,tincidunt erat 中的Cras。

我也不想要那个 solr highlight 2016 文本。我希望它只加粗 Lorem。我应该怎么做才能实现它?

0 投票
0 回答
305 浏览

solrcloud - solr.KeywordTokenizerFactory 不适用于通配符和空格

我的 schema.xml 具有以下字段类型:

以下数据存在于其中一个方面(不带双引号):pub_title:"Current Concept on the Classification and Treatment of Spondylolistes"

我在 q 的 solr 查询控制台上触发以下查询,但没有得到任何结果:

当我尝试使用下面的 q 参数进行搜索时,它可以工作,但搜索操作需要两倍的时间:

我想要一个完整的字符串(不带双引号)“当前关于脊椎滑脱分类和治疗的概念”的方面。我还需要强调这个领域。

我尝试使用solr.StandardTokenizerFactory,但方面已被标记化。

请让我知道我哪里出错了。

谢谢, 普拉内

0 投票
0 回答
109 浏览

solr - Solr 突出显示以包括搜索返回的连字符结果

如果包含连字符,有没有办法让 Solr 突出显示匹配项?

在下图中,搜索是1600并且 Solr 突出显示了完全匹配。但是,搜索也匹配,16-00但未突出显示。这些是产品 sku,即使它们是连字符的,我们也会尝试突出显示它们。

Solr 版本:5.2.1

添加的唯一设置hl.fl如下。其余所有未设置并使用 Solr 默认值: <requestHandler name="standard" class="solr.StandardRequestHandler" default="true"> <!-- default values for query parameters --> <lst name="defaults"> <str name="echoParams">explicit</str> <str name="hl.fl">summary title </str>

注意:图像的部分已被编辑。这就是结果不一致的原因。

在此处输入图像描述

0 投票
2 回答
239 浏览

solr - Solr 突出显示匹配的查询词

我正在使用 Solr 进行模糊搜索(例如,foo~2 bar~2)。突出显示允许我突出显示结果集中匹配的文档片段。

例如:

Result 1: <em>food</em> <em> bars</em> Result 2: mars <em>bar</em>

等等。

对于文档中突出显示的每个匹配项,我需要确定这些片段与哪些查询词匹配,以及查询中这些查询词的偏移量。就像是:

Result 1: {<em>food</em> MATCHED_AGAINST foo QUERY_OFFSET 0,2} {<em> bars</em> MATCHED_AGAINST bar QUERY_OFFSET 3,5} Result 2: mars {<em>bar</em> MATCHED_AGAINST bar QUERY_OFFSET 3,5}

有没有办法在 Solr 中做到这一点?

0 投票
1 回答
97 浏览

solr - 如何突出显示最长的 solr 令牌

我试图突出显示查询中的确切搜索词,但突出显示的词作为我标记化字段中最短的标记返回。例如,查询“Entr”将导致突出显示Entr。我希望高亮返回Entry

这是匹配答案中每个术语实例的最简单查询:q=Title_Tokens:Entr&hl=on&hl.fl=Title_Tokens&hl.useFastVectorHighlighter=true

删除 FastVectorHighlighter 会给出整个术语,但每个结果只有一次,并且在某些情况下它不匹配。

我尝试添加 hl.q、hl.highlightingMultiTerm、hl.usePhraseHighlighter 和其他几个变量,但我只能获取最短标记的每个实例或搜索词的第一个实例。

我要突出显示的字段是 Title_Tokens,它是从字符串中复制的。

在分析“entr”字段时,我看到“ent、entr 和 ntr”的标记。对我来说,看起来第一个匹配的标记被突出显示,但我想优先考虑最长的匹配。这是正在发生的事情,还是我做错了什么?

我还考虑过使用 EdgeNGramTokenizerFactory 从单词的后面进行匹配,但这会在单词的中间停止匹配。

0 投票
1 回答
48 浏览

solr - solr 8.2 的突出问题

部分突出显示solr 8.2对我来说效果不佳。我可以使用NGramTokenizerFactory. 但亮点似乎现在不起作用。

这是字段类型定义:

这是我的领域:

询问:

预期亮点:

当前输出亮点: