5

我想索引大量的 pdf 文档。

我找到了一个参考,表明它可以使用 Apache Tika 来完成,但不幸的是,我找不到任何描述我可以在 Solr 1.4.1 中配置 Apache Tika 的参考。

配置完成后,我确实配置了它,如何在不使用 curl 的情况下直接将文档发送到 Solr?

我正在使用 solrnet 进行索引。

4

2 回答 2

5

请参阅ExtractingRequestHandler

于 2010-10-05T13:12:54.510 回答
3

SolrNet中对ExtractingRequestHandler 的支持尚未完成。您可以完成实现它,也可以解决它并制作您自己的 HttpWebRequests。

于 2010-10-05T14:08:14.200 回答