1

我正在使用 Solr 和 ExtractingRequestHandler 来索引文档,但我不知道如何执行与 Tika setMaxStringLength() 等效的操作。

它似乎正在索引所有较小的文档,而不是大型文档的所有文本,这可能意味着它没有设置 tika.setMaxStringLength(-1)

是否可以在 solrconfig.xml 中设置值?使用 curl 发布时是否可以将值与其他参数一起传递?

4

1 回答 1

2

检查 Solr 配置文件的限制

<maxFieldLength>10000</maxFieldLength>

这会限制字段长度,这可能会给您带来问题。

您使用的是哪个版本的 solr,因为它可能已被弃用。

SolrConfig 中的 IndexConfig

在 Solr 4 中删除了 maxFieldLength 参数。如果限制字段的长度对您很重要,您可以使用 LimitTokenCountFactory 获得类似的行为,它可以为您想要限制的字段定义。例如,将字段限制为 10,000 个字符。

于 2013-05-24T03:36:40.180 回答