我的环境:
- AWS 上的 kubernetes 1.8.4,使用 kops 部署。
- Heapster 1.5.0 带有 influxdb sink 和 60s 公制分辨率
当我的 pod 空闲或流量低时,一切都很好。我的 HPA 可以从 heapster 中获取数据,我可以在 grafana 上查看数据,将其从 influxdb 中提取出来。
当我开始对 Pod 进行负载测试时(将其置于某些流量下,从 10 rqs/秒开始),我停止获取有关 grafana 中 CPU 使用率的信息,HPA 开始获取以下信息:
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Warning FailedGetResourceMetric 2m (x13 over 3h) horizontal-pod-autoscaler unable to get metrics for resource cpu: no metrics returned from heapster
Warning FailedComputeMetricsReplicas 2m (x13 over 3h) horizontal-pod-autoscaler failed to get cpu utilization: unable to get metrics for resource cpu: no metrics returned from heapster
加载完成后,我几乎立即获得了 influxdb 和 HPA 中的 CPU 指标。请注意,在同一时期,我从未丢失过有关内存使用情况的数据。
任何有关故障排除和/或解决此问题的帮助将不胜感激。
为了记录,我还在heapster的github上发布了一个问题:https ://github.com/kubernetes/heapster/issues/1937