0

如何在我的 solr_home 目录中存储的 odt 文件中发布、索引和搜索内容?

我已经尝试理解和应用下面提到的页面,并在架构中包含了一个 body 字段:

索引文本和 html 文件

简单的帖子工具-Confluence

resourcename 字段包含文件位置,但 content 字段为空。但我仍然无法搜索文件内容,即使它显示文件已编入索引并且更改已提交。是否有针对此类要求的端到端文档。我在 linux 机器上使用 solr 和 Tomcat。我是 solr 的新手,可能会错过上述页面中未提及的细节。

4

2 回答 2

0

需要 Apache Tika。在Apache Tika 下载

于 2014-02-28T06:52:31.107 回答
0

使用 Apache tika 提取内容并将其发送到 SOLR

Tika tika = new Tika();
InputStream fileInputStream = new FileInputStream("d:\\fileName.odt");
Metadata metadata = new Metadata();
metadata.set(Metadata.RESOURCE_NAME_KEY, "fileName.odt");

String content = tika.parseToString(fileInputStream, metadata);

或者,您也可以使用ExtractingRequestHandler

于 2014-02-28T09:51:25.737 回答