0

我们的 ES 存在问题。合并的速度不如摄取/更新快,因此我们有大量已删除的文档,占用了额外 65% 的空间。我读过合并是自动发生的,我们也可以使用 ES 命令强制执行,但除非我停止项目摄取/更新,否则两者似乎都不起作用。ES 为我们对数百万个项目的聚合查询提供了出色的性能,因此我们将其用作我们的主数据库。

我们从 ES 2.X 切换到 ES 5.5 仍然存在这个问题。

我玩过 forcemerge、分片大小、分片计数和停止摄取。只有最后一个有效。

我们有什么方法可以在不停止项目摄取/更新的情况下减少此已删除文档的数量?

4

1 回答 1

1

在 Elasticsearch 5.x 上,如果合并落后,应该有一种机制来背压索引速率。想知道是否是这种情况。您可以使用另一种设置,它根据删除的数量决定何时触发合并。您可以将其配置为合并策略的一部分,请参阅

https://github.com/elastic/elasticsearch/blob/master/core/src/main/java/org/elasticsearch/index/MergePolicyConfig.java

于 2017-08-04T08:13:26.350 回答