我需要多久在 SolrCloud 上运行一次完整的重新索引?完整的重新索引运行需要超过 12 个小时,我们每晚都运行它,但是当 delta 运行正确时真的有必要这样做。新数据以每 30 秒每个 delta 2000 个文档的速度进入。总索引大小:20GB Solr:6.5.2
问问题
136 次
1 回答
0
如果 delta 运行正确,则根本不需要运行重新索引。例外情况可能是您在索引运行时没有禁用任何合并;在这种情况下,您最终可能会得到一个非常碎片化的索引文件,并且重新索引最终会构建一个完整的集合作为单个索引文件,但通常不是 Solr 的配置方式,如果是这样 - 它已经完成了原因。
所以 - 如果你的 delta 工作正常并且你使用相当标准的设置运行 Solr,你可以安全地跳过重新索引,除非你从一个空索引重新开始(或者有架构发生变化的情况)。但请确保这也包括删除 - 重新索引可能不包括已删除的元素,因此问题就变成了您的增量导入是否也处理删除。
我们基于 Solr 的服务根本没有重新索引 - 一切都是通过实时更新和体面的合并因素完成的。
于 2017-12-28T21:43:19.990 回答