7

我已经按照 prometheus文档设置了 prometheus 来监控 kubernetes 指标 。

许多有用的指标现在出现在普罗米修斯中。

但是,我看不到任何引用我的 pod 或节点状态的指标。

理想情况下 - 我希望能够绘制 pod 状态(Running、Pending、CrashLoopBackOff、Error)和节点(NodeReady、Ready)。

这个指标在任何地方吗?如果没有,我可以在某处添加它吗?如何?

4

3 回答 3

8

常规的 kubernetes 设置不会公开这些指标 -在此处进一步讨论。

但是,可以使用另一个服务来收集这些集群级别的指标:https ://github.com/kubernetes/kube-state-metrics 。

这目前提供了 node_status_ready 和 pod_container_restarts 听起来像我想要的。

于 2016-09-08T13:25:02.890 回答
1

我认为不存在这样的指标。

您必须修改源代码才能添加它们。看看这个关于如何注册指标的文件:https ://github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/metrics/metrics.go ,看看这一行如何记录一个指标:https ://github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/pleg/generic.go#L180

于 2016-09-06T21:49:45.967 回答
-1

我发现我可以使用 heapster & snap 来监控这些指标,这对于我的案例来说是一个可行的解决方法。让我知道你是否也在使用它,我会给你适当的指标来获取这些数据。

于 2018-02-12T08:46:48.753 回答