在使用 Helm(2.6.2 版)在 Kubernetes 中部署服务数月后,我们开始在执行--upgrade
命令时遇到随机错误。
大多数情况下升级超时,而在其他情况下,它看起来像是发生了网络问题,出现了类似getsockopt: connection refused
或TLS handshake timeout
.
有时我们也见过the server cannot complete the requested operation at this time, try again later (get configmaps)
。
我们每天使用 Helm 将多个版本的服务部署到 CI 环境中,而开始蔓延的部署过程的不稳定性正在影响我们的生产力。
知道我应该寻找什么来将--upgrade
命令恢复到可靠状态吗?