1

我已经将大约 15k 文档加载到各种大小的 Solr 中。我测量的最大的是 59,455 个纯文本字符。当我使用突出显示和无限片段大小执行查询时,这个大文档被截断为 51,253(这包括我的 pre 和 post 标记)。

这是查询的 URL:

http://solr.nowhere.org:8080/solr/select?fl=*,score&sort=score%20desc&hl=true&hl.fragsize=-1&hl.fl=note&hl.simple.pre=<hit>&hl.simple.post=</hit>&hl.q=corn&q=corn

为什么 Solr 仍然截断?

我正在使用 Solr 4.0。

4

1 回答 1

3

您还需要提高hl.maxAnalyzedChars的值,因为该值也限制了突出显示的结果。

文档中有多少字符以寻找合适的片段。此参数仅对原始荧光笔有意义。

默认值为“51200”。

您可以为此参数分配一个较大的值,并使用 hl.fragsize=0 在大小大于 51200 个字符的大字段中返回突出显示。

因此,基于此更改并向参数hl.fragsize=0添加一个大于最长文档的值hl.max.analyzedChars

于 2013-03-27T01:34:22.423 回答