我正在使用 ExtractingRequestHandler 使用 Solr 为 PDF 编制索引。我想在文档中显示页码以及命中,例如“在第 2、3 和 5 页foo
找到术语”。bar.pdf
是否可以像这样在查询结果中包含页码?
我正在使用 ExtractingRequestHandler 使用 Solr 为 PDF 编制索引。我想在文档中显示页码以及命中,例如“在第 2、3 和 5 页foo
找到术语”。bar.pdf
是否可以像这样在查询结果中包含页码?
这将需要一些开发工作,但您可以通过将每个文档的每个页面索引为单独的 Solr 文档来实现这一点,然后使用字段折叠对每个文档的不同页面命中进行分组。
请注意,您需要每晚为此,在任何当前发布的 Solr 版本中都没有实现字段折叠。
另请注意:字段折叠在Solr 3.3版本中实现。预计下一个大版本(Solr 4.0)会有更多更新