问题标签 [prometheus-alertmanager]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
3697 浏览

kubernetes - Prometheus 在节点处于不可调度状态时触发警报

有人可以帮我编写一个 promql 查询来获取节点状态,无论节点是否可调度。提前致谢。

0 投票
2 回答
11964 浏览

docker - 无法使用 docker (prom/prometheus) 加载 prometheus.yml 配置文件

我正在尝试使用以下自定义 conf 文件通过 docker 加载 prometheus:danilo@machine:/prometheus-data/prometheus.yml

使用以下命令:

该文件已经存在。但是,我收到以下消息:

level=error ts=2018-09-26T17:45:00.586704798Z caller=main.go:617 err="error loading config from "/prometheus-data/prometheus.yml": 无法加载配置 (--config. file="/prometheus-data/prometheus.yml"): 打开 /prometheus-data/prometheus.yml: 没有这样的文件或目录”

我正在遵循本指南:

我该怎么做才能正确加载此文件?

0 投票
1 回答
519 浏览

python - 我在 Kubernetes 环境中自定义数据的 Prometheus 客户端

我们正在运行 Kubernetes 1.9.1。我们正在使用基于 Kubernetes 客户端 python 的库脚本连接到 Kubernetes 服务器并生成一些与 pod 相关的信息,例如当前处于终止状态的 pod 列表。我们想将此数据作为指标发送到 prometheus 服务器,并希望在 prometheus 中发出警报。我是否需要创建普罗米修斯的自定义指标来实现这一目标?将使用 prometheus 客户端在我的 python 脚本中创建 prometheus 警报?

0 投票
1 回答
875 浏览

prometheus-alertmanager - alertmanger 无法加载配置文件

我在启动 Alertmanager 时收到以下错误消息:

与工作配置文件的唯一区别是将以下内容添加到文件末尾:

我正在使用 Alertmanager 0.15.2。

知道是什么原因造成的吗?

0 投票
1 回答
1034 浏览

prometheus-alertmanager - alertmanager:自定义接收器或带有自定义 POST 有效负载的 webhook 接收器?

有没有办法修改 webhook 接收器的 POST 有效负载?

如果没有:是否有关于如何编写自己的接收器的文档或模板?

0 投票
0 回答
988 浏览

prometheus - Prometheus 检查指标是否消失

我想根据一个指标发出警报,在我的情况下,有时可能会消失 指标的名称 count_items 每 10 分钟返回一次数字,如果数字 < 750000,则触发警报,如果指标不存在 = OK 或指标计数 > 750000 = OK 我做了

请说我的解决方法

这种方式不起作用https://www.robustperception.io/existential-issues-with-metrics Prometheus 版本 2

0 投票
1 回答
822 浏览

prometheus - 如何在 Prometheus + AlertManager 中将警报添加到某些 Prometheus 作业名称?

我为几个团队运行了一个 prometheus 实例,我希望能够为各个团队管理的服务器添加警报。

一个例子可能比我能解释的更清楚:

假设 Team-A 想要添加一些服务器以供 Prometheus 监控。此外,他们希望在某些情况下(内存不足、停机等)发出警报。

目前,通过我的设置,所有作业名称中的所有服务器都使用相同的规则集进行监视和警报。我想要的是这样的:

Docker-Servers 收到警报组警报-A
Nginx-Servers 收到警报组警报-B

我不确定要在 Prometheus.yml 和 alert.rules.yml 文件中做什么才能实现这一点。

任何帮助表示赞赏。

0 投票
1 回答
237 浏览

kubernetes - 如何从 Prometheus 的警报中禁用注释描述

我有一个正在运行的 Prometheus,并通过 alertmanager 为我的 slack 配置了警报。我可以通过它的描述获得触发的警报。为此,我在我的配置文件中添加了以下内容。

但现在我的问题是,当警报得到解决时,会生成相同的描述。有没有办法禁用已解决消息的警报描述?

0 投票
3 回答
13463 浏览

prometheus - 如何在 Prometheus 中为磁盘空间配置警报

我们在 Win Server 机器上运行 prometheus,在单独的机器(客户端)上运行 WMI 导出器。能够读取 Prometheus 中的客户端指标。现在的要求是在 Diskspace =>90 % 的那一刻,发送电子邮件警报,以便我们可以运行作业以使用自动作业/手动作业清理空间。

你能帮忙看看如何为磁盘空间> 90配置警报吗

在此处输入图像描述

0 投票
2 回答
2684 浏览

yaml - 在 Slack 中自定义 Prometheus AlertManager 通知

我有几个安装和配置 WMI 的 Win 服务器(如 Build、DB、App 等),并且能够在我的 Prometheus 仪表板上读取指标(基于磁盘空间 > 90 等规则)。

在同一个盒子上设置一个 Altermanager,我将 Metrics (Diskspace >90) 详细信息写入我的 Slack Channel。

Slack 通知的输出是 - 实际

在此处输入图像描述 有没有一种方法可以让我准备好机器名称 - 以及将其与标签名称区分开来 - 如 Build、Db 等?

我希望通知更具可读性,如下所示,(我从一些博客中得到)你能建议吗?

预期的 在此处输入图像描述

任何投入都受到高度赞赏。

谢谢,