我想索引大量的 pdf 文档。
我找到了一个参考,表明它可以使用 Apache Tika 来完成,但不幸的是,我找不到任何描述我可以在 Solr 1.4.1 中配置 Apache Tika 的参考。
配置完成后,我确实配置了它,如何在不使用 curl 的情况下直接将文档发送到 Solr?
我正在使用 solrnet 进行索引。
我想索引大量的 pdf 文档。
我找到了一个参考,表明它可以使用 Apache Tika 来完成,但不幸的是,我找不到任何描述我可以在 Solr 1.4.1 中配置 Apache Tika 的参考。
配置完成后,我确实配置了它,如何在不使用 curl 的情况下直接将文档发送到 Solr?
我正在使用 solrnet 进行索引。
SolrNet中对ExtractingRequestHandler 的支持尚未完成。您可以完成实现它,也可以解决它并制作您自己的 HttpWebRequests。