“kube-state-metrics”的相关标签问题

0 投票

1 回答

365 浏览

kubernetes - 当 k8s 集群中的特定 pod 进入 Failed 状态时如何配置警报？

我们在spark-operator的帮助下在 k8s 集群上运行 spark 。我们使用prometheus进行监控。

我们想要配置一个警报，以便每当与 spark 作业相关的任何 pod 转换为Failed状态时，我们都应该收到警报。并且此警报规则应在过去 5 分钟内检查此类失败的 pod。

我们试图为此利用kube-state-metrics，但我们无法根据时间获取指标。在任何给定的时间点，度量kube_pod_status_phase{namespace="spark-operator",phase="Failed"}为我们提供了所有处于失败状态的 Pod 的列表。

非常欢迎对此提出任何建议或指导。

2020-07-13T15:14:07.030

0 投票

1 回答

1185 浏览

local - Helm 无法找到本地图表来更新依赖项

我正在使用 helm 3 在我的 vanilla k8s 集群上安装 Prometheus。Prometheus 带有 kube-state-metrics 图表依赖项。我的机器完全无法访问互联网，所以我的所有开发都是本地的。我已经安装了图表博物馆，里面有我的回购。但是，当我尝试更新依赖项时，无论是从本地路径到 chart.yaml 还是chart-museum url，都无法找到它。

我已经尝试了大多数解决方案，到目前为止没有任何效果。

local prometheus kubernetes-helm kube-state-metrics

2020-08-28T22:55:17.433

0 投票

1 回答

624 浏览

prometheus - 在 prometheus-operator 中扩展 kube-state-metrics

在 Prometheus-operator 中，我想将kube-state-metrics副本数增加到 2。如果我增加副本数，并且由于默认的服务发现角色是endpoints，Prometheus 将抓取每个 pod，因此我会将所有指标抓取两次，这将导致多对 -很多问题，这是一种浪费。

我遇到的问题是一个节点出现故障，kube-state-metrics其中包括其他节点。在安排新的 pod 之前，我不知道集群上发生了什么。有kube-state-metrics多余的对我来说很重要。

如何将kubernetes_sd_configs角色配置为kube-state-metrics，service以便将服务作为负载均衡器，而不是服务中的每个 pod？或者 - 我如何缩放kube-state-metricspod（不分片）？

当前配置：

我想要的是：

prometheus prometheus-operator kube-state-metrics

2020-10-18T13:29:59.127

0 投票

0 回答

149 浏览

kubernetes - 如何加入 2 组 Prometheus 指标？

我的用例：我想在我的 1 个持久卷不处于“绑定”阶段时发出警报，并且仅当它属于预定义的一组命名空间时发出警报。
这让我第一次尝试加入 Prometheus 指标 - 所以，请多多包涵 :)

我选择使用以下方法来获取 pv 阶段：

渲染：

这很好用，除了它不包含命名空间。所以我设法用这个确定了 persistentvolumeclaim 命名空间：

渲染：

所以我的想法是将这些集合与以下字段中的匹配值结合起来：
(kube_persistentvolume_status_phase)persistentvolume
on
(kube_persistentvolumeclaim_info)volumename

但是，如果我理解正确，您只能在完全匹配的标签上加入两个指标集（文本及其值）。因此，我选择了“实例”和“工作”标签，因为它们在双方都很常见并且匹配。

渲染：

所以平心而论，查询确实可以很好地传达问题所在 - 所以我尝试使用“忽略”选项来解决这个问题 - 尝试只保留匹配的标签和值（实例和作业）并“排除/忽略”两边不匹配的。这也不起作用 - 导致解析错误。这反过来又促使我退后一步，重新评估我在做什么。

我只是有点担心我可能在这里吠错了树。
我的问题是：这有可能吗？如果可以，怎么办？或者是否有另一种更谨慎的方法来实现这一目标？

提前致谢！

kubernetes prometheus azure-aks promql kube-state-metrics

2020-11-17T12:42:57.333

0 投票

1 回答

325 浏览

kubernetes - Prometheus 指标与 kubernetes 仪表板中的 kubestate 指标不匹配

Kubernetes 仪表板中的指标：

kubectl 顶级报告：

Prometheus Grafana 仪表板中的指标：

我使用 helm chart prometheus-community/kube-prometheus-stack 安装了 Prometheus 操作员设置。谁能解释一下为什么指标有差异？由于 prometheus 和 kubernetes 仪表板都使用 kube-state-metrics。哪个更好用？

kubernetes grafana prometheus-node-exporter kube-state-metrics

2020-12-14T10:43:27.110

0 投票

0 回答

64 浏览