两个Node集群Node A、Node B。
服务 X 在节点 A 上运行,节点 B 是 DC。
我们将堆栈 corosync 与 Pacemaker 一起使用。失败超时为 10 秒。目标角色已启动。
事件发生如下 节点 A 向节点 B 发送事件 服务 X 已关闭 节点 B 打印 Ignoring expired failure for Service X 在此服务 X 永远不会被集群重新启动之后。
现在的问题是:
- 为什么 Node B (DC) 忽略过期故障?
- 即使此时 DC 被忽略,但由于服务 X 已关闭,节点 A 应监视服务并再次将故障状态发送到节点 B,此时节点 B 应重新启动服务。为什么这没有发生?