kubernetes - 不受 StackDriver 监控的 GKE 集群

Question

尽管启用了 Cloud Monitoring，但 Stackdriver 不会监控我的 GKE 集群。特别是https://app.google.stackdriver.com/gke仅报告“您没有任何此类资源被 Stackdriver 监控”。

运行 Kubernetes 1.2.4 的集群，创建于 2016 年 5 月中旬。
有些在创建时启用了 Cloud Monitoring，有些则通过gcloud container clusters update serve --monitoring-service=monitoring.googleapis.com.
所有集群都在运行heapster2/2 就绪的 pod，状态为 Running，没有重新启动，例如heapster-v1.0.2-594732231-76sdj.
所有集群都使用heapster集群 IP、没有外部 IP 和端口 80/TCP 运行服务。
heapsterpod、容器的日志heapster如下所示：

I0609 09:15:05.000189 1 manager.go:79] 抓取指标开始：2016-06-09 09:14:00 +0000 UTC，结束：2016-06-09 09:15:00 +0000 UTC

I0609 09:15:05.023729 1 manager.go:152] ScrapeMetrics：时间：23.435264ms 大小：25

heapsterpod、容器的日志heapster-nanny如下所示：

I0609 09:18:03.968201 1 nanny_lib.go:90] 节点数为 1

I0609 09:18:03.971459 1 nanny_lib.go:98] 容器资源为 &{map[memory:{213909504.000000000 BinarySI} cpu:{0.100000000 DecimalSI}] map[cpu:{0.100000000 DecimalSI} memory:{21390009504.00000}]

I0609 09:18:03.971522 1 nanny_lib.go:102] 预期资源是 &{map[cpu:{0.100000000 DecimalSI} 内存：{218103808.000000000 BinarySI}] map[cpu:{0.100000000 DecimalSI} 内存：{21800003808.000}]}

I0609 09:18:03.971634 1 nanny_lib.go:106] 资源在预期限制内。

https://status.cloud.google.com将所有服务显示为绿色。

score 2 · Accepted Answer

事实证明，Stackdriver 存在无法在其 UI 中正确显示新集群的问题。指标被正确收集，并且始终可以通过他们的 API获得。问题现在应该已经解决了，但是团队对由此造成的任何麻烦感到非常抱歉，并将努力更快地发现此类问题。

kubernetes - 不受 StackDriver 监控的 GKE 集群

1 回答 1

Related

Reference