如何在我的 solr_home 目录中存储的 odt 文件中发布、索引和搜索内容?
我已经尝试理解和应用下面提到的页面,并在架构中包含了一个 body 字段:
resourcename 字段包含文件位置,但 content 字段为空。但我仍然无法搜索文件内容,即使它显示文件已编入索引并且更改已提交。是否有针对此类要求的端到端文档。我在 linux 机器上使用 solr 和 Tomcat。我是 solr 的新手,可能会错过上述页面中未提及的细节。
如何在我的 solr_home 目录中存储的 odt 文件中发布、索引和搜索内容?
我已经尝试理解和应用下面提到的页面,并在架构中包含了一个 body 字段:
resourcename 字段包含文件位置,但 content 字段为空。但我仍然无法搜索文件内容,即使它显示文件已编入索引并且更改已提交。是否有针对此类要求的端到端文档。我在 linux 机器上使用 solr 和 Tomcat。我是 solr 的新手,可能会错过上述页面中未提及的细节。
需要 Apache Tika。在Apache Tika 下载
使用 Apache tika 提取内容并将其发送到 SOLR
Tika tika = new Tika();
InputStream fileInputStream = new FileInputStream("d:\\fileName.odt");
Metadata metadata = new Metadata();
metadata.set(Metadata.RESOURCE_NAME_KEY, "fileName.odt");
String content = tika.parseToString(fileInputStream, metadata);
或者,您也可以使用ExtractingRequestHandler