1

我是 Solr 的第一次用户,在 Windows 7 系统上使用 v3.5 和 Tomcat 7。我浏览了 example-docs 中的 XML 示例,没有任何问题。但是,我将需要对 HTML 和 PDF 文件进行提取,当我尝试发布 PDF 文件进行索引时,我得到以下信息:

SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8080/solr/update/extract?literal.id=doc2..
SimplePostTool: POSTing file test.pdf
SimplePostTool: FATAL: Solr returned an error #500 Internal Server Error

我使用的命令是:

java -Durl=http://localhost:8080/solr/update/extract?literal.id=doc2 -Dtype=application/pdf -jar post.jar test.pdf

我的 solr 主目录是 C:\solr,到目前为止,我在其中完成了以下操作:

  • 复制 solr 下载包的 example/solr 文件夹的内容
  • 将solr下载包的contrib/extraction/lib文件夹复制到C:\solr\lib
  • 将solr下载包的dist/apache-solr-cell-3.5.0.jar复制到C:\solr\dist\apache-solr-cell-3.5.0.jar
  • 将 C:\solr\conf\solrconfig.xml 中相应的“lib”标签修改为<lib dir="lib" /><lib dir="dist/" regex="apache-solr-cell-\d.*\.jar" />

我还需要做什么才能使 PDF 和 HTML 文件正常工作?我已经阅读了多个教程和“入门”指南,但似乎无法理解出了什么问题。我也是一个 Tomcat 初学者,据我所知,这些都没有出现在 Tomcat 的日志中......所以我几乎被卡住了。同样,我对 XML 示例没有任何问题,因此 Tomcat 本身运行良好并且可以识别 solr(我可以看到 solr 管理页面)。任何帮助表示赞赏。

4

0 回答 0