问题标签 [prometheus-operator]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1843 浏览

prometheus - Prometheus 保留时间设置为 1 年,但不会将数据保留超过默认 15 天

我最近安装了 Prometheus 并使用 Grafana 进行报告。

在安装过程中设置了 Prometheus,保留时间为 1 年 --storage.tsdb.retention.time=1y \

现在,我们从昨天开始注意到 15 天前的数据不再显示。我的代码有问题吗?1y没有被识别吗?

0 投票
1 回答
2484 浏览

amazon-web-services - Prometheus 警报管理器不发送警报 k8s

我使用 prometheus 操作员 0.3.4 和警报管理器 0.20,但它不起作用,即我看到警报被触发(在警报选项卡上的 prometheus UI 上),但我没有收到任何电子邮件警报。通过查看日志,我看到以下内容,有什么想法吗?请查看粗体警告也许这就是原因,但不知道如何解决它......

这是我使用的普罗米修斯运营商的掌舵者: https ://github.com/helm/charts/tree/master/stable/prometheus-operator

这是我的配置 yaml

https://codebeautify.org/yaml-validator/cb6a2781

该错误表示它在解析中失败,调用的 pod 名称alertmanager-monitoring-prometheus-oper-alertmanager-0已启动并正在运行,但是它尝试解析:查找alertmanager-monitoring-prometheus-oper-alertmanager-0.alertmanager-operated.monitoring.svc不确定为什么...

这是输出kubectl get svc -n mon

更新 这是警告日志

这是kubectl get svc -n mon

0 投票
1 回答
97 浏览

azure - Helm 不接受值 YAML

我正在安装prometheus operator,我采用了默认的helm chart并通过以下命令安装它:

使用图表。

安装成功但是它没有从values.yaml文件中获取值,我做错了什么?例如,我们看不到警报管理器的两个副本(最小可重复性)

猫值.yaml

yaml 的值位于我执行命令的文件夹中。我正在使用 Helm 3

0 投票
1 回答
1358 浏览

amazon-web-services - helm 不使用 values.yaml 文件

我使用 helm 安装带有稳定图表的 prometheus 操作符,它按预期完成了所有配置,

这是values.yaml

当我运行helm install mon stable/prometheus-operator -n mon -f values.yaml
一切正常时,我能够看到3警报管理器实例并在日志中看到版本0.20.0

现在我需要做一些我创建的配置和掌舵图helm create v2chart

将我的配置文件添加到template图表的文件夹并添加以下内容requirements.yaml并运行helm dep update ./v2chart

我现在在根目录下的图表文件夹中看到prometheus-operator-8.5.0.tgz

现在在根上运行我运行 helmhelm install mon -f values.yaml . -n mon

它采用默认图表值而不是我的values.yaml配置(我只看到 1 个版本为 0.19 的警报管理器实例)

我在这里想念什么?

顺便说一句,我看到模板中的配置文件配置正确,但是values.yaml在安装过程中不需要...

0 投票
2 回答
1661 浏览

kubernetes - Prometheus 仪表板暴露在入口控制器上

我正在尝试在 k8 集群中设置 Prometheus,能够使用 helm 运行。当我使用外部 IP 将 prometheus-server 公开为 LoadBalancer 服务时访问仪表板。当我尝试将此服务配置为 ClusterIP 并使用入口控制器将其作为后端时,同样不起作用。收到 404 错误,关于如何解决此问题的任何想法?

有了上面的入口定义,url“http://<>/prometheus/被重定向到http://<>/graph/,然后404错误页面被渲染。当 url 调整为 http://<>/prometheus/graph 时,一些 web 控件会在浏览器控制台上呈现很多错误。

0 投票
2 回答
2531 浏览

kubernetes - Helm 3.0.2 试运行 + stable/prometheus-operator?这应该工作吗?

使用 Helm v3.0.2 + 一个新的 Kubernetes v1.14.9 集群。

仅供参考,我已经添加了稳定的回购:

我认为 Helm 3 与现有图表向后兼容?这是一个例外吗?

prometheus-operator 与 Helm 3 不兼容吗?我必须使用 Helm 2 吗?还是有向后兼容的选项?

0 投票
2 回答
2410 浏览

grafana - 如何在使用 grafana 和 prometheus-operator 时配置电子邮件警报

我通过 helm 安装了 prometheus-operator(包括 prometheus/alertmanager/grafana)。然后我通过电子邮件访问 Grafana UI 和配置警报。当我点击发送电子邮件测试时,我收到消息“ SMTP 未配置,请检查您的 grafana.ini 配置文件的 [smtp] 部分”</p>

在此处输入图像描述

但我不知道在这种情况下 grafana.ini 可以在哪里改变。

0 投票
1 回答
3775 浏览

nginx - Nginx 入口控制器没有为普罗米修斯提供指标

我正在尝试部署一个可以使用 prometheus 监控的 nginx 入口控制器,但是我遇到了一个问题,即似乎没有像我在网上找到的大多数帖子和文档那样创建指标 pod。

我正在使用 helm 部署入口控制器并使用 CLI 参数来启用指标。

这是我的入口文件

如果这会有所不同,我将使用带有以下命令的 prometheus 操作员舵图。

所有命名空间都已经存在,所以这不应该成为问题,至于我在很多地方看到的开发与监控命名空间,这是可以接受的,所以我使用它来让事情更容易弄清楚发生了什么。

0 投票
2 回答
1317 浏览

kubernetes - 随着时间的推移自动加入普罗米修斯,没有输出

普罗米修斯:v2.15.2 Kubernetes:v1.14.9

我有一个查询,它准确地显示了在设定时间段内随时间变化的最大值。但我想加入 kube_pod_container 资源中已经设置的指标。

我想知道设置的内容是否接近设置的百分比,显示百分比。

我还有其他使用相同度量结构的示例

jvm_memory_bytes_used{instance="url.instance.com.br"} / jvm_memory_bytes_max{area="heap"} * 100 > 80

但这一个不起作用。

max_over_time(sum(rate(container_cpu_usage_seconds_total{pod="pod-name-here",container_name!="POD", container_name!=""}[1m])) [1h:1s]) / kube_pod_container_resource_requests_cpu_cores * 100 < 70

那么第一个想法是创建一个查询来收集容器在短时间内的最大历史 cpu 使用率:

max_over_time(sum(rate(container_cpu_usage_seconds_total{pod="xpto-92838241",container_name!="POD", container_name!=""}[1m])) [1h:1s])

元素:{}值: 0.25781324101515

如果我们这样执行:

container_cpu_usage_seconds_total{pod="xpto-92838241",container_name!="POD", container_name!=""}

元素: container_cpu_usage_seconds_total{beta_kubernetes_io_arch="amd64",beta_kubernetes_io_instance_type="t3.small",beta_kubernetes_io_os="linux",cluster="teste.k8s.xpto",container="xpto",container_name="xpto",cpu="total ",failure_domain_beta_kubernetes_io_region="sa-east-1",failure_domain_beta_kubernetes_io_zone="sa-east-1c",generic="true",id="/kubepods/burstable/poda9999e9999e999e9-/99999e9999999e9",image="nginx",instance= "kubestate-dev.internal.xpto",job="kubernetes-cadvisor",kops_k8s_io_instancegroup="nodes",kubernetes_io_arch="amd64",kubernetes_io_hostname="ip-99-999-9-99.sa-east-1.compute .internal",kubernetes_io_os="linux",kubernetes_io_role="node",name="k8s_nginx_nginx-99999e9999999e9",namespace="nmpc",pod="pod-92838241",pod_name="pod-92838241",spot="false"}值: 22533.2

现在我们有了配置:

kube_pod_container_resource_requests_cpu_cores{pod="xpto-92838241"}

元素: kube_pod_container_resource_requests_cpu_cores{container="xpto",instance="kubestate-dev.internal.xpto",job="k8s-http",namespace="nmpc",node="ip-99-999-999-99.sa -east-1.compute.internal",pod="pod-92838241"}值: 1

好吧,在我看来,这将是使用这两个指标并使其接近这样的百分比:

max_over_time(sum(rate(container_cpu_usage_seconds_total{pod="xpto-dev-92838241",container_name!="POD", container_name!=""}[1m])) [1h:1s]) / kube_pod_container_resource_requests_cpu_cores * 100 < 70

元素: 无数据 值:

但是这两个指标不交互,我不明白为什么,也没有在文档中找到。

问候

0 投票
1 回答
669 浏览

postgresql - 您如何从 postgresql 获取 prometheus 指标?

我在 kube-prometheus 之后将 prometheus 安装到了我的 Kubernetes v1.17 KOPS 集群,确保设置了--authentication-token-webhook=true--authorization-mode=Webhook prerequisets并指定了kube-prometheus/kube-prometheus-kops.libsonnet配置。

然后,我使用提供的values-production.yaml使用https://github.com/helm/charts/tree/master/stable/postgresql安装了 Postgres ,并具有以下设置:

两种服务都已启动并正常工作,但 prometheus 没有从 Postgres 中发现任何指标。
我的 postgres pod上的容器上的日志metrics没有错误,monitoring命名空间中的任何 pod 也没有。
让 Postgres 指标导出器到达 Prometheus 还需要哪些额外步骤?