问题标签 [prometheus-operator]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
6537 浏览

kubernetes - 核心os项目kube-prometheus和prometheus operator有什么区别?

Prometheus Operator https://github.com/coreos/prometheus-operator/项目的 github repo说

Prometheus Operator 使 Prometheus 配置 Kubernetes 原生,并管理和操作 Prometheus 和 Alertmanager 集群。这是关于完整的端到端监控的一部分。

kube-prometheus 将 Prometheus Operator 与清单集合相结合,以帮助开始监控 Kubernetes 本身以及在其上运行的应用程序。

有人可以详细说明吗?

0 投票
1 回答
581 浏览

amazon-web-services - k8s - 使用 Promethues 和 cAdvisor 来监控微服务/Pod 数据

Prometheus operator在新的 Kubernetes 集群中运行,并尝试获取容器详细信息。Prometheus 的查询仪表板不提供任何容器数据,当我查看目标时,我看到以下内容

在此处输入图像描述

也许是因为角色,但我不确定,因为我是这个主题的新手,所以我也看到了这个: https ://github.com/coreos/prometheus-operator/issues/867 我添加了authentication-token-webhook哪个没有帮助,但也许我没有在正确的地方做......

知道我在这里想念什么吗?

我的 operator.yml 配置如下所示

我的 rbac 看起来像以下

如果缺少某些配置文件,请告诉我,我会添加它。

0 投票
1 回答
122 浏览

prometheus - Prometheus 向量搜索不包括某些标签

我有很多指标,但我不想包括以下三个指标

我的查询是

但我得到错误显示执行查询时出错:

在 char 30 处解析错误:错误解析正则表达式:无效的嵌套重复运算符:**

0 投票
1 回答
1580 浏览

prometheus - 从节点到 daemonset/kube-prometheus-exporter-node 的标签

prometheus-operator 包含 DaemonSet 以将 node-exporter 部署到集群中的每个节点。它有效,但我们缺少一些有用的标签信息,例如:

所以我们在标签中有有用的信息——ip-1 是 master,ip-2 是 worker 等等。

但是此信息在节点导出器目标上丢失,因为节点标签不会传播到守护进程节点导出器 pod。

因此,在普罗米修斯中,例如,我不能按节点的类型对节点进行分组。

也许有办法实现这一目标?谢谢!

0 投票
1 回答
1322 浏览

kubernetes - K8S - Not able to see alerts via - alertmanager

I've Prometheus operator which is working as expected https://github.com/coreos/prometheus-operator

Now I want to apply the alert manager from scratch

After reading the docs im came out with those yamls. but the problem is when I entered to the UI Nothing is shown, any idea what I miss here ?

http://localhost:9090/alerts I use port forwarding ...

This is all the config files I've apply to my k8s cluster I just want to do some simple test to see that it working and then extend it to our needs...

alertmanger_main.yml

alertmanger_service.yml

testalert.yml

alertmanager.yml

and to create secret I use

kubectl create secret generic alertmanager-main --from-file=alertmanager.yaml

what I need is some basic alerts in K8S and I follow the documatation but didnt find any good step by step tutorial

enter image description here

I've also now changed the service to LoadBalancer and I try to enter like

when I hit the browser with

nothing happen...

0 投票
1 回答
4689 浏览

prometheus - 在由 prometheus-operator helm chart 设置的 Kubernetes 集群上更新 Prometheus 安装的规则和配置的正确方法?

我已经通过 helm chart https://github.com/helm/charts/tree/master/stable/prometheus-operator配置 了 Prometheus 我需要动态更新 Prometheus 规则和配置(热重载),但由于某种原因,它是不工作。

我尝试为 Prometheus 规则编辑 cofigmap,但是一旦我保存更改,更改就会恢复。我曾尝试删除 Prometheus configmap,它会立即重新生成。我还尝试删除 Prometheus pod 本身,但它也会立即重新创建。

如果自定义控制器和 CRD 是这背后的原因(即拒绝更改),那么正确的方法是什么?

0 投票
1 回答
694 浏览

kubernetes - 部署 Prometheus 监控 Kubernetes 的最佳实践是什么?

部署 prometheus 来监控 K8s 集群似乎有几种不同的方法,主要是通过 Prometheus Operator 或通过创建清单并自己管理部署的所有细节。

部署 Prometheus 和 Grafana 来监控 K8s 集群时,首选的行业最佳实践是什么?

用例是在集群级别、节点级别和 pod 级别监控资源使用情况。

0 投票
1 回答
366 浏览

prometheus - 如何在 Prometheus 本地磁盘上设置 Thanos 备份历史数据

我正在做一个 POC,使用 Prometheus-operator 将 Thanos 集成到我们的 Prometheus 集群。系统运行良好,每两小时将本地文件上传到 S3。但是,看起来 sidecar 没有在 Prometheus 本地磁盘上备份我们的历史数据。在我减少保留后,这些数据丢失了。我不确定是否应该通过某些设置启用历史数据备份,还是 Sidecar 只能备份动态生成的数据?如果是这种情况,我们如何将历史数据备份到 S3?谢谢。

0 投票
4 回答
22880 浏览

kubernetes - 如何使用配置文件使 Prometheus Alertmanager 静音?

我正在使用官方的stable/prometheus-operator图表来使用 helm 部署 Prometheus。

到目前为止,它运行良好,除了针对CPUThrottlingHigh许多 pod(包括自己的 Prometheus 的config-reloaders 容器)触发的烦人警报。此警报目前正在讨论中,我想暂时将其通知静音。

Alertmanager 具有静音功能,但它是基于 Web 的:

静音是在给定时间内简单地将警报静音的简单方法。静音在 Alertmanager 的 Web 界面中配置。

有一种方法可以通过CPUThrottlingHigh使用配置文件来静音通知吗?

0 投票
1 回答
671 浏览

prometheus - kubelet 在普罗米修斯目标中失败

我已经使用 helm 安装了 prometheus-operator。一切正常,但后来我将工作组更改为 t2.large。

现在我在 grafana 仪表板和 prometheus 目标中看不到任何内容

对于端点 http://10.10.11.207:10255/metrics/cadvisorhttp://10.10.11.207:10255/metrics

有什么建议我该如何解决?