问题标签 [solr-highlight]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - 突出显示不起作用:HighlightComponent.process() 第 139 行中的 NullPointerException
尝试在 Solr 4.7.2 中进行简单的突出显示。我正在构建示例中提供的标准 solrconfig.xml。我已经修改了/select
请求处理程序,如下所示:
但是当我执行搜索时,我得到一个 NPE:
如果我<str>highlight</str>
从 solrconfig.xml 中删除,则查询有效。我正在执行的查询是:
solr - SOLR-高亮搜索文本?这可能吗
我从 SOLR 开始,所以如果这个问题是愚蠢的或类似的问题,请不要激怒我。我正在阅读 solr 文档,发现有一个叫做“highlight”的东西。我有非常简单的查询:
text 是我的索引中的一个字段,我试图突出显示此查询仅突出显示第一次命中的所有结果:
我做错了什么?是否有任何可能性,例如在高亮显示后削减 50 个字符,并且不仅突出显示第一次点击
solr - 使用 PostingsSolrHighlighter 进行自定义
我正在使用带有默认参数的 PostingsSolrHighlighter,它似乎给出了很好的结果。我的用例是针对完整文档搜索文本段落并获取相关片段,这个荧光笔确实提供了匹配文档中最接近的段落。
我需要的自定义是删除似乎与搜索的段落无关的浪费片段。目前,我正在寻找一种简单的方法:删除相对分数为 0.5 或更低的片段。但是我找不到一种方法来获得 Solr 为句子/片段计算的分数,所以我可以丢弃不太需要的分数。
我可以告诉 solr 仅在其分数大于 xyz 分数时才保留片段,或者它可以以某种方式给我片段分数吗?
我仍然想保持结果片段的顺序(根据原始文档中片段的起始位置)。
谢谢。
solr - Solr 突出显示外部字段
我想使用 Solr 突出显示,但我们的文档仅被索引而不是存储。字段值可在单独的数据库中找到。有没有办法传入要突出显示的文本,而 Solr 不需要从其自己的存储字段中提取该文本?或者是否有一个接口可以让我传入查询、字段名称、字段值并取回片段?
我在 Solr 5.1 上。
solr - 在 solr 中突出显示查询词的匹配文本
我安装了 solr jetty 5.1.3,并使用 tika 索引了超过 15000 个文档。我已经在 SOLR 中索引并存储了文档发布日期和内容。我在 solrConfig.xml 中启用了突出显示,这是突出显示术语的请求处理程序的 xml
它最多返回三个亮点,搜索文本为粗体。就像我在查询词中搜索“Lorem”一样,它会向我返回一个类似的亮点
Lorem ipsum dolor sit amet 2016, consectetur adipiscing elit。sed volutpat metus lorem,一个placerat nibh sodales in。在mauris tempus,vulputate felis eu,tincidunt erat 中的Cras。
但是当我搜索发布日期在过去 1 年到现在之间的文档时,它突出显示了两个术语。例如,如果我搜索““Lorem”和 docPublishDate:[2015-01-20 TO 2016-01-20]”,那么它会向我返回类似这样的亮点:
Lorem ipsum dolor sit amet 2016 , consectetur adipiscing elit。sed volutpat metus lorem,一个placerat nibh sodales in。在mauris tempus,vulputate felis eu,tincidunt erat 中的Cras。
我也不想要那个 solr highlight 2016 文本。我希望它只加粗 Lorem。我应该怎么做才能实现它?
solrcloud - solr.KeywordTokenizerFactory 不适用于通配符和空格
我的 schema.xml 具有以下字段类型:
以下数据存在于其中一个方面(不带双引号):pub_title:"Current Concept on the Classification and Treatment of Spondylolistes"
我在 q 的 solr 查询控制台上触发以下查询,但没有得到任何结果:
当我尝试使用下面的 q 参数进行搜索时,它可以工作,但搜索操作需要两倍的时间:
我想要一个完整的字符串(不带双引号)“当前关于脊椎滑脱分类和治疗的概念”的方面。我还需要强调这个领域。
我尝试使用solr.StandardTokenizerFactory
,但方面已被标记化。
请让我知道我哪里出错了。
谢谢, 普拉内
solr - Solr 突出显示以包括搜索返回的连字符结果
如果包含连字符,有没有办法让 Solr 突出显示匹配项?
在下图中,搜索是1600
并且 Solr 突出显示了完全匹配。但是,搜索也匹配,16-00
但未突出显示。这些是产品 sku,即使它们是连字符的,我们也会尝试突出显示它们。
Solr 版本:5.2.1
添加的唯一设置hl.fl
如下。其余所有未设置并使用 Solr 默认值:
<requestHandler name="standard" class="solr.StandardRequestHandler" default="true">
<!-- default values for query parameters -->
<lst name="defaults">
<str name="echoParams">explicit</str>
<str name="hl.fl">summary title </str>
注意:图像的部分已被编辑。这就是结果不一致的原因。
solr - Solr 突出显示匹配的查询词
我正在使用 Solr 进行模糊搜索(例如,foo~2 bar~2
)。突出显示允许我突出显示结果集中匹配的文档片段。
例如:
Result 1: <em>food</em> <em> bars</em>
Result 2: mars <em>bar</em>
等等。
对于文档中突出显示的每个匹配项,我需要确定这些片段与哪些查询词匹配,以及查询中这些查询词的偏移量。就像是:
Result 1: {<em>food</em> MATCHED_AGAINST foo QUERY_OFFSET 0,2} {<em> bars</em> MATCHED_AGAINST bar QUERY_OFFSET 3,5}
Result 2: mars {<em>bar</em> MATCHED_AGAINST bar QUERY_OFFSET 3,5}
有没有办法在 Solr 中做到这一点?
solr - 如何突出显示最长的 solr 令牌
我试图突出显示查询中的确切搜索词,但突出显示的词作为我标记化字段中最短的标记返回。例如,查询“Entr”将导致突出显示Entr。我希望高亮返回Entry
这是匹配答案中每个术语实例的最简单查询:q=Title_Tokens:Entr&hl=on&hl.fl=Title_Tokens&hl.useFastVectorHighlighter=true
删除 FastVectorHighlighter 会给出整个术语,但每个结果只有一次,并且在某些情况下它不匹配。
我尝试添加 hl.q、hl.highlightingMultiTerm、hl.usePhraseHighlighter 和其他几个变量,但我只能获取最短标记的每个实例或搜索词的第一个实例。
我要突出显示的字段是 Title_Tokens,它是从字符串中复制的。
在分析“entr”字段时,我看到“ent、entr 和 ntr”的标记。对我来说,看起来第一个匹配的标记被突出显示,但我想优先考虑最长的匹配。这是正在发生的事情,还是我做错了什么?
我还考虑过使用 EdgeNGramTokenizerFactory 从单词的后面进行匹配,但这会在单词的中间停止匹配。
solr - solr 8.2 的突出问题
部分突出显示solr 8.2
对我来说效果不佳。我可以使用NGramTokenizerFactory
. 但亮点似乎现在不起作用。
这是字段类型定义:
这是我的领域:
询问:
预期亮点:
当前输出亮点: