Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在尝试从 solr 中找到搜索结果的位置检索页码。我发现将每个页面索引为单独的 solr 文档是可行的。但我似乎找不到从 pdf 文件中索引单个页面的方法。
有没有人找到一种方法来用 solr 索引文档的单页?
您可以使用任何库,例如pdfbox,以便分别从每个页面中提取文本并将不同的文档提交给 Solr