问题标签 [prometheus-operator]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
prometheus-operator - 如何在 jsonnet 中进行嵌套 for 循环并访问变量?
我如何访问t
,这是我从外循环得到的东西?
我的数组看起来像这样:
我想遍历所有部署/服务并将它们放在单独的键中,以便将它们放入单独的文件中。
prometheus - 无法在 prometheus-adapter 中获取 springboot 执行器指标
已配置 prometheus-operator 以捕获 springboot pod 指标(通过执行器)。
能够在 prometheus 图形 UI 上查询指标http_server_requests_seconds_count
但http_server_requests_seconds_count
查询时看不到相同的指标custom-metrics api
适配器的 cm 输出描述
描述 prometheus-adapter pod
prometheus - 联合服务器的 Promql 查询
利用 prometheus federation 进行 kubernetes 监控。
尝试为多个集群更改此 promql 查询:
数数
将 clustername 作为外部标签添加到 prometheus 服务器。
请你指导我好吗?
prometheus - 计算 Prometheus 中的计数减少
我正在 Prometheus 中寻找一个选项来给我增加()的反面。我可以看到 increase()、change()、delta(),但没有一个特别提到随着时间的推移减少计数。我已经多次使用增加来检查错误数量是否在一段时间内增加:
增加(http_request_failure[5m]) > 5
现在,出于警报目的,我需要查找特定计数是否在一段时间内减少。事实证明,没有减少功能。我如何找出负方向的变化?某个指标的计数在 5 分钟内减少了多少?
谢谢, 阿纳夫
kubernetes - Kubernetes 类型的对象和 Prometheus 算子
请帮助我了解一件事Prometheus
并Prometheus operator
集成到 Kubernetes。
从文档中我看到一种新的而非标准的 Kubernetes 对象用于配置Prometheus operator
. 我的意思是标准种类,,,Pod
等等Service
。ReplicaSet
新Deployment
的喜欢PrometheusRule
和Prometheus
被创造出来的?这里有一个整合点?
让我想到这个问题的文档在这里https://github.com/coreos/prometheus-operator/blob/master/Documentation/user-guides/alerting.md
此类 Kubernetes 对象 YAML 的示例
kubernetes - Prometheus-operator 无法获取 pod CPU/内存使用情况
我在我的 k8s 集群上安装了 Prometheus operator Helm chart。我查看了 Grafana,可以看到节点 CPU 和内存使用情况。但是 Prometheus 无法收集 pod CPU/内存使用情况。
例如sum(rate(container_cpu_usage_seconds_total{container_name!="POD",pod_name!=""}[5m]))
会返回no data
.
kubectl top pod
工作正常,所以我不明白为什么普罗米修斯无法获得这些数据。或者上面的规则可能是错误的?
我在用着:
- Minikube 1.4.0
- kvm2 驱动程序
- Kubernetes 1.15.4
- Ubuntu 18.04.3
prometheus - Prometheus 目标显示 kubelet 的 403
我使用 prometheus 来监控 pod 的 cpu 和网络使用情况。但是像 cpu_usage_seconds 这样的指标并没有出现在 prometheus 中。
当我检查 kubelet 目标已关闭时。
我正在使用 helm 的 stable/prometheus-operator:
kubernetes - 某些东西在自定义 k8s 命名空间中重新创建了 ConfigMap
在 GKE 上有一个 Prometheus 操作员和一些由我创建的带有 Prometheus 规则的 ConfigMap。今天我发现,我不能再更改/删除那个 ConfigMap。每次它都以先前的状态重新创建。在过去,它不是一成不变的。
这可能是什么原因?
- K8S主控:1.13.7-gke.24
- K8S节点:1.13.6-gke.13
- 普罗米修斯:v2.4.3
- 普罗米修斯运营商:v0.24.0
- 配置映射重新加载:v0.0.1
- Prometheus-config-reloader:v0.24.0
kubernetes - Prometheus alertmanager 由于“超出上下文截止日期”而无法发送通知
我用prometheus-msteams配置了prometheus-operator chart,用于 k8s 集群的监控和告警。
但所有通知均未正确定向到 MSteams 频道。如果我有 6 个正在触发的警报,我可以在警报管理器的 UI 中看到它们,但其中只有一两个被发送到 MS 团队频道。
我可以在 alertmanager pod 中看到此日志:
我该如何解决这个错误?
编辑 :
该设置使用 prometheus-msteams 作为 webhook 将警报通知从 alertmanager 重定向到 MSTeams 通道。
prometheus-msteams 容器日志也有一些错误:
可能是由于400 bad request
prometheus-msteams 的这个错误,alertmanager 正在返回unexpected status code 500
。
kubernetes - promethues operator alertmanager-main-0 挂起并显示
发生了什么? kubernetes 版本:1.12 promethus 操作员:release-0.1 我按照自述文件:
然后我使用命令然后显示如下:
我不知道为什么 pod altertmanager-main-0 挂起并显示然后重新启动。我看到了这个事件,它显示为: