你没有提到你的部署策略。但是我在 k8s 部署中看到的一个普遍问题是,如果应用程序无法启动,它将无限重启。因此,您可能必须kubectl delete deploy/******
在检测到部署失败状态后明确说明。(也有failureThreshold
探针,但我还没有尝试)。
案例重建:
您可以使用 和 的progressDeadlineSeconds
组合readinessProbe
。假设您的应用程序需要 60 秒来启动/启动。您需要配置progressDeadlineSeconds
多一点 60 秒只是在更安全的一面。现在,在运行您的 后kubectl apply -f my-deploy.yaml
,运行kubectl rollout status deploy/my-deployment
命令。对我来说,它看起来像这样:
12:03:37 kubectl apply -f deploy.yaml
12:03:38 deployment "my-deployment" configured
12:04:18 kubectl rollout status deploy/my-deployment
12:04:18 Waiting for rollout to finish: 0 of 1 updated replicas are available (minimum required: 1)...
12:04:44 deployment "my-deployment" successfully rolled out
一旦你执行了这个rollout
命令,kubectl 会一直等到它有答案。它还返回正确的退出代码echo $?
- 您可以通过编程方式检查并删除部署。
案例滚动更新:
如果您有多个副本,那么上述技巧应该可以工作。如果您只有一个副本,请使用maxUnavailable: 0
和maxSurge: 1
连同上述配置。