由于网络问题或维护,运行 DaemonSet 的 kubernetes 节点无法再访问 kubernetes master。pod 仍在运行,直到主机重新启动。
如果节点重新启动但仍无法访问主节点,是否有可能重新启动 pod?
该映像来自运行在 Kubernetes 主服务器上的 docker 注册表,因此在这种情况下,与注册表的连接也会丢失。Pod 中运行的软件能够在离线时记录数据并在网络可用时重新发送,但如果由于 docker 进程未启动而发生重启,则不会发生这种情况。
编辑:示例用例是:集群主节点离线。从节点仍在运行。然后从节点由于电源复位而重新启动。重启后 Pod 没有在 slave 上启动,但是守护进程 docker 正在运行(docker ps -a 显示了 Pod 的 docker ps 但它们没有运行)。
目标:让 pod 的 docker 进程在重启时启动。并且在集群主节点恢复后仍然能够管理 Pod。