我的问题只是此活动的延续,我想在输入文档中显示搜索词的页码。
所以我用
1) tika-0.9.jar将输出提取为中间文件。
2) 然后我创建另一个 XML,其中提取的输出是输入,并以 Solr 预期的格式写入数据,然后使用post.jar命令发布此 xml。
3) 我使用Solritas Serach UI和Solr 3.2版本 ( http://localhost:8983/solr/browse ) 来查看结果。
我想显示页面编号以及结果。
例子 :
如果我在输入 PDF 中搜索单词测试,到目前为止我所管理的是显示包含此结果的所有文档集,然后单击任何文档,输入 PDF 将打开。我想在每个输入文档中显示这个词说“测试”的页面编号。
请给我一些建议,比如这是否可以通过一些如何在索引中存储页码来完成。
非常欢迎您提出建议。
谢谢并恭祝安康。