我们最近将我们的 kubernetes 控制平面从 1.13 版本升级到 1.16
之后,我们开始在 prometheus 报告仪表板上看到针对 apiserver 的 WATCH 操作的 0(零)响应代码。
我尝试运行 kubectl 命令来观看具有特定标签的 pod 子集并收到 200OK,因此我无法从我的最终重现它。
我们使用的指标是
sum(rate(apiserver_request_count{code!~"^2.*$"}[1m])) by (code, resource, subresource, verb)
我尝试寻找可能是什么原因的任何线索,我发现的唯一线索是https://github.com/kubernetes/kubernetes/issues/16686
这是我们应该担心的事情,还是只是新 apiserver 的细微差别?
谢谢你的帮助!