我已经按照 prometheus文档设置了 prometheus 来监控 kubernetes 指标 。
许多有用的指标现在出现在普罗米修斯中。
但是,我看不到任何引用我的 pod 或节点状态的指标。
理想情况下 - 我希望能够绘制 pod 状态(Running、Pending、CrashLoopBackOff、Error)和节点(NodeReady、Ready)。
这个指标在任何地方吗?如果没有,我可以在某处添加它吗?如何?
我已经按照 prometheus文档设置了 prometheus 来监控 kubernetes 指标 。
许多有用的指标现在出现在普罗米修斯中。
但是,我看不到任何引用我的 pod 或节点状态的指标。
理想情况下 - 我希望能够绘制 pod 状态(Running、Pending、CrashLoopBackOff、Error)和节点(NodeReady、Ready)。
这个指标在任何地方吗?如果没有,我可以在某处添加它吗?如何?
我认为不存在这样的指标。
您必须修改源代码才能添加它们。看看这个关于如何注册指标的文件:https ://github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/metrics/metrics.go ,看看这一行如何记录一个指标:https ://github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/pleg/generic.go#L180
我发现我可以使用 heapster & snap 来监控这些指标,这对于我的案例来说是一个可行的解决方法。让我知道你是否也在使用它,我会给你适当的指标来获取这些数据。