我对 Apache SOlr 比较陌生,最近一直在使用 DIH,特别是 XPathEntityProcessor。我需要一种方法来定期索引新的 XML 文件,但是,似乎 delta-import 命令仅受 sqlEntityProcessor [1] 支持。
我正在处理越来越大的 XML 文件数据集,并希望 solr 可以确定新文件并为它们编制索引......
想到的一个潜在解决方案是,在将文档移动到其各自的永久位置之前,可能从包含先前未索引的文档的暂存区域进行完全导入。
- 是否有使用 XPathEntityProcessor 模拟 delte-import 的解决方法?
- 使用 XPathEntityProcessor 的人使用什么样的方法来索引较新的文档?
[1] http://wiki.apache.org/solr/DataImportHandler#Using_delta-import_command-1