我有一个 Mongo 副本集正在运行。这是配置:
- sj01-A(初级)
- sj01-B(二级)
- dal05-A(二级)
- dal05-B(二级)
- 仲裁者
几个月来,它一直在平稳地嗡嗡作响。没有真正的问题。昨晚深夜,我们的监控通知我,其中一个辅助服务器在复制方面落后了。目前大约落后一个小时,并且不断落后(以缓慢的速度)。其他辅助节点都没有这个问题——它们跟上主节点没有问题。
我在任何这些机器上的日志中都找不到任何东西来表明可能是什么原因。我过去有过复制滞后的经验,但它总是影响到每一个二级服务器,而不仅仅是一个二级服务器。这感觉像是硬件问题,但这些是物理机器(没有虚拟化),我们的供应商运行检查似乎表明没有问题。
如果他们有帮助,请提供更多信息:
- 滞后的二级服务器现在的负载大约是其他二级服务器的一半。大约一半的磁盘 IO 和网络,以及更少的内存使用。
- 我们不会以任何方式使用上限集合。
- 所有机器都具有相同的硬件配置(仲裁器除外)。
我很感激给予的任何指导。谢谢!