在 Solr 中如何处理以下场景DataImportHandler
?我们每天对所有文档进行一次完整导入(完整索引运行大约需要 1 小时)。我们所有的文档都分为两类,比如 A 和 B。只有 3% 的文档属于 A 类,并且这些文档经常被修改。我们每 10 分钟通过 deltaQuery 使用修改后的时间重新索引 A 类中的文档。到这里为止一切都很好。
现在,我们还想每小时重新索引一次 A 类中的所有文档(因为我们在不同的表中有一个 view_count 列,并且当我们更新 view_count 时文档修改时间不会改变)。这个怎么做?
更新(短期解决方案):现在我们决定根本不使用增量中的修改时间,而是每 10 分钟重新索引 A 类中的所有文档。索引 A 类文档只需要 3 分钟,所以我们现在可以了。不过,任何解决方案都会有所帮助。