Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在使用 Solr 和 ExtractingRequestHandler 来索引文档,但我不知道如何执行与 Tika setMaxStringLength() 等效的操作。
它似乎正在索引所有较小的文档,而不是大型文档的所有文本,这可能意味着它没有设置 tika.setMaxStringLength(-1)
是否可以在 solrconfig.xml 中设置值?使用 curl 发布时是否可以将值与其他参数一起传递?
检查 Solr 配置文件的限制
<maxFieldLength>10000</maxFieldLength>
这会限制字段长度,这可能会给您带来问题。
您使用的是哪个版本的 solr,因为它可能已被弃用。
SolrConfig 中的 IndexConfig
在 Solr 4 中删除了 maxFieldLength 参数。如果限制字段的长度对您很重要,您可以使用 LimitTokenCountFactory 获得类似的行为,它可以为您想要限制的字段定义。例如,将字段限制为 10,000 个字符。