1

当我们的容器注册表和整个 K8S 集群都断电时,我们发生了重大故障。当集群恢复得比容器注册表快时,我的 pod(statefulset 的一部分)卡在 Error: ImagePullBackOff.

是否有配置设置可以定期重试从 CR 下载图像或无需人工干预即可恢复?

我看了看,imagePullPolicy但这不适用于 CR 不可用的情况。

4

1 回答 1

1

BackOff 状态部分ImagePullBackOff 意味着 Kubernetes 一直在尝试从注册表中拉取镜像,并具有指数回退延迟(10 秒、20 秒、40 秒……)。 每次尝试之间的延迟都会增加,直到达到 300 秒(5 分钟)的编译限制 - Kubernetes 文档中有更多信息。

backOffPeriod图像拉取的参数是 Kuberenets 中的硬编码常量,不幸的是现在不可调整,因为它会影响节点性能 - 否则,可以在自定义 kubelet 二进制文件的代码中调整它。使其可调整的问题仍然存在。

于 2022-02-25T15:50:48.913 回答