2

我正在尝试索引一些 PDF 文档,然后创建一个 Search UI 。

这个问题有点相关

Solr 索引 PDF 文档并将它们发布到远程服务器

1)索引PDF文档->我使用tika jar将PDF转换为文本文件,然后使用curl命令对其进行索引。

2) 搜索 UI --> 我正在使用Solritas浏览功能及其内置 UI。

客观的 :

当我在索引文档列表中搜索单词“Lucene”时,当我获得给定查询的结果集时,我希望为每个返回的文档显示一个链接,并单击我应该能够打开的任何文档那个文件。

我目前的想法:

我想我可能必须将第一步从两步更改为直接索引它们的一步。我什至认为 schema.xml 中应该有一个额外的字段来说明这些 PDF 文档的位置。

请指导我一些建议

4

1 回答 1

1

这可能会有所帮助:

http://wiki.apache.org/solr/ExtractingRequestHandler

于 2011-07-26T05:05:01.627 回答