我们运行一个 TokuMX 副本集(2 个实例 + 仲裁器),其中包含大约 120GB 数据(在磁盘上)和大量索引。
自从升级到 TokuMX 2.0 后,我们注意到重启 SECONDARY 实例总是需要很长时间。在切换到正常模式之前,数据库一直卡在 STARTUP2 1 小时以上。当服务器处于 STARTUP2 时,它以持续的 CPU 负载运行 - 我们假设它正在重建其索引,即使它之前已正确关闭。
虽然这很烦人,但由于 PRIMARY 可用,它不会导致停机。但最近在延长维护期间,我们需要重新启动两个实例。我们先停止 SECONDARY,然后是 PRIMARY,然后以相反的顺序启动它们。但这导致两者都占用了完整的 1 小时以上的启动时间,因此此时副本集不可用。
如果不等待这么长时间就无法重新启动可能已关闭的副本集,这是我们不愿承担的风险。
有没有办法避免在启动时(可能的)完全索引重建?