1

尽管启用了 Cloud Monitoring,但 Stackdriver 不会监控我的 GKE 集群。特别是https://app.google.stackdriver.com/gke仅报告“您没有任何此类资源被 Stackdriver 监控”。

  • 运行 Kubernetes 1.2.4 的集群,创建于 2016 年 5 月中旬。
  • 有些在创建时启用了 Cloud Monitoring,有些则通过gcloud container clusters update serve --monitoring-service=monitoring.googleapis.com.
  • 所有集群都在运行heapster2/2 就绪的 pod,状态为 Running,没有重新启动,例如heapster-v1.0.2-594732231-76sdj.
  • 所有集群都使用heapster集群 IP、没有外部 IP 和端口 80/TCP 运行服务。
  • heapsterpod、容器的日志heapster如下所示:

I0609 09:15:05.000189 1 manager.go:79] 抓取指标开始:2016-06-09 09:14:00 +0000 UTC,结束:2016-06-09 09:15:00 +0000 UTC

I0609 09:15:05.023729 1 manager.go:152] ScrapeMetrics:时间:23.435264ms 大小:25

  • heapsterpod、容器的日志heapster-nanny如下所示:

I0609 09:18:03.968201 1 nanny_lib.go:90] 节点数为 1

I0609 09:18:03.971459 1 nanny_lib.go:98] 容器资源为 &{map[memory:{213909504.000000000 BinarySI} cpu:{0.100000000 DecimalSI}] map[cpu:{0.100000000 DecimalSI} memory:{21390009504.00000}]

I0609 09:18:03.971522 1 nanny_lib.go:102] 预期资源是 &{map[cpu:{0.100000000 DecimalSI} 内存:{218103808.000000000 BinarySI}] map[cpu:{0.100000000 DecimalSI} 内存:{21800003808.000}]}

I0609 09:18:03.971634 1 nanny_lib.go:106] 资源在预期限制内。

4

1 回答 1

2

事实证明,Stackdriver 存在无法在其 UI 中正确显示新集群的问题。指标被正确收集,并且始终可以通过他们的 API获得。问题现在应该已经解决了,但是团队对由此造成的任何麻烦感到非常抱歉,并将努力更快地发现此类问题。

于 2016-06-14T21:52:56.773 回答