0

我有一个 pdf 文档,我正在尝试使用 solr 单元对其进行索引。我使用以下命令:

 curl "http://localhost:8983/solr/update/extract?   stream.file=/home/Desktop/DOCUMENTS/x.pdf&stream.contentType=application/pdf&literal.id=DOC_N&commit=true"

问题是当我搜索“:”时,我发现它只索引了文本字段中的目录。文档的内容未编入索引。我对 solr 还很陌生,不知道为什么会发生这种情况。

4

1 回答 1

1

也许文档文本大于<maxFieldLength>您可以尝试将<maxFieldLength>solrconfig.xml 中的内容更改为更高的内容,然后重新索引。

http://wiki.apache.org/solr/SolrConfigXml#mainIndex_Section

于 2012-05-18T17:57:24.643 回答