0

我正在尝试从 solr 中找到搜索结果的位置检索页码。我发现将每个页面索引为单独的 solr 文档是可行的。但我似乎找不到从 pdf 文件中索引单个页面的方法。

有没有人找到一种方法来用 solr 索引文档的单页?

4

1 回答 1

1

您可以使用任何库,例如pdfbox,以便分别从每个页面中提取文本并将不同的文档提交给 Solr

于 2012-08-16T12:04:29.527 回答