问题标签 [prometheus-operator]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3891 浏览

prometheus-operator - 如何在 jsonnet 中进行嵌套 for 循环并访问变量?

我如何访问t,这是我从外循环得到的东西?

我的数组看起来像这样:

我想遍历所有部署/服务并将它们放在单独的键中,以便将它们放入单独的文件中。

0 投票
0 回答
478 浏览

prometheus - 无法在 prometheus-adapter 中获取 springboot 执行器指标

已配置 prometheus-operator 以捕获 springboot pod 指标(通过执行器)。

能够在 prometheus 图形 UI 上查询指标http_server_requests_seconds_count

http_server_requests_seconds_count查询时看不到相同的指标custom-metrics api

适配器的 cm 输出描述

描述 prometheus-adapter pod

0 投票
1 回答
217 浏览

prometheus - 联合服务器的 Promql 查询

利用 prometheus federation 进行 kubernetes 监控。

尝试为多个集群更改此 promql 查询:

数数

将 clustername 作为外部标签添加到 prometheus 服务器。

请你指导我好吗?

0 投票
0 回答
1533 浏览

prometheus - 计算 Prometheus 中的计数减少

我正在 Prometheus 中寻找一个选项来给我增加()的反面。我可以看到 increase()、change()、delta(),但没有一个特别提到随着时间的推移减少计数。我已经多次使用增加来检查错误数量是否在一段时间内增加:

增加(http_request_failure[5m]) > 5

现在,出于警报目的,我需要查找特定计数是否在一段时间内减少。事实证明,没有减少功能。我如何找出负方向的变化?某个指标的计数在 5 分钟内减少了多少?

谢谢, 阿纳夫

0 投票
1 回答
60 浏览

kubernetes - Kubernetes 类型的对象和 Prometheus 算子

请帮助我了解一件事PrometheusPrometheus operator集成到 Kubernetes。

从文档中我看到一种新的而非标准的 Kubernetes 对象用于配置Prometheus operator. 我的意思是标准种类,,,Pod等等ServiceReplicaSetDeployment的喜欢PrometheusRulePrometheus被创造出来的?这里有一个整合点?

让我想到这个问题的文档在这里https://github.com/coreos/prometheus-operator/blob/master/Documentation/user-guides/alerting.md

此类 Kubernetes 对象 YAML 的示例

0 投票
0 回答
1362 浏览

kubernetes - Prometheus-operator 无法获取 pod CPU/内存使用情况

我在我的 k8s 集群上安装了 Prometheus operator Helm chart。我查看了 Grafana,可以看到节点 CPU 和内存使用情况。但是 Prometheus 无法收集 pod CPU/内存使用情况。
例如sum(rate(container_cpu_usage_seconds_total{container_name!="POD",pod_name!=""}[5m]))会返回no data.
kubectl top pod工作正常,所以我不明白为什么普罗米修斯无法获得这些数据。或者上面的规则可能是错误的?

我在用着:

  • Minikube 1.4.0
  • kvm2 驱动程序
  • Kubernetes 1.15.4
  • Ubuntu 18.04.3
0 投票
1 回答
760 浏览

prometheus - Prometheus 目标显示 kubelet 的 403

我使用 prometheus 来监控 pod 的 cpu 和网络使用情况。但是像 cpu_usage_seconds 这样的指标并没有出现在 prometheus 中。

当我检查 kubelet 目标已关闭时。

我正在使用 helm 的 stable/prometheus-operator:

截图普罗米修斯

0 投票
1 回答
123 浏览

kubernetes - 某些东西在自定义 k8s 命名空间中重新创建了 ConfigMap

在 GKE 上有一个 Prometheus 操作员和一些由我创建的带有 Prometheus 规则的 ConfigMap。今天我发现,我不能再更改/删除那个 ConfigMap。每次它都以先前的状态重新创建。在过去,它不是一成不变的。

这可能是什么原因?

  • K8S主控:1.13.7-gke.24
  • K8S节点:1.13.6-gke.13
  • 普罗米修斯:v2.4.3
  • 普罗米修斯运营商:v0.24.0
  • 配置映射重新加载:v0.0.1
  • Prometheus-config-reloader:v0.24.0
0 投票
1 回答
6045 浏览

kubernetes - Prometheus alertmanager 由于“超出上下文截止日期”而无法发送通知

我用prometheus-msteams配置了prometheus-operator chart,用于 k8s 集群的监控和告警。

但所有通知均未正确定向到 MSteams 频道。如果我有 6 个正在触发的警报,我可以在警报管理器的 UI 中看到它们,但其中只有一两个被发送到 MS 团队频道。

我可以在 alertmanager pod 中看到此日志:

我该如何解决这个错误?

编辑 :

该设置使用 prometheus-msteams 作为 webhook 将警报通知从 alertmanager 重定向到 MSTeams 通道。

prometheus-msteams 容器日志也有一些错误:

可能是由于400 bad requestprometheus-msteams 的这个错误,alertmanager 正在返回unexpected status code 500

0 投票
1 回答
1202 浏览

kubernetes - promethues operator alertmanager-main-0 挂起并显示

发生了什么? kubernetes 版本:1.12 promethus 操作员:release-0.1 我按照自述文件:

然后我使用命令然后显示如下:

我不知道为什么 pod altertmanager-main-0 挂起并显示然后重新启动。我看到了这个事件,它显示为: