1

我们的生产 MarkLogic DB 有 1.2 TB 的数据,分布在 6 个森林中。我们计划增加 2 个新森林以减少每森林数量的林分。

现在,添加新森林开始重新平衡数据。没关系,这需要时间。但是,每当合并与再平衡同时开始时,这个再平衡时间就会不断增加。有时需要,估计8小时,突然到16小时。因此,平均而言,整个过程大约需要 24 小时。

我的问题是- 如果我们在添加新森林之前禁用合并并在重新平衡完成后不久启用手动合并(在添加森林之后),合并过程会更快吗?而且,这样做安全吗?

4

2 回答 2

2

任何影响磁盘 IO 的因素都会影响重新平衡的速度,包括合并和标准数据库活动,但是如果您禁用合并,则应小心。

禁用合并的风险是您阻止系统修剪支架,因此如果堆积太多支架,您可能会达到硬限制,这将影响服务器操作。

如果合并的影响如此之大,那么您可以考虑调整合并配置。更多信息可以在文档中找到。

于 2020-04-02T15:51:58.483 回答
0

除了提供的其他信息外,分配策略可能会影响完成的工作量。参见例如:https ://docs.marklogic.com/guide/admin/database-rebalancing#id_81616 。如果系统不堪重负,您还可以设置重新平衡器油门以使其工作更慢。但是,如果您在重新平衡时关闭合并,我敢打赌您会很快遇到 TOOMANYSTANDS 错误,因为由于重新平衡器需要写入小支架,但无法合并到更大+更少的支架.

于 2020-04-02T19:58:37.923 回答