1

我为几个团队运行了一个 prometheus 实例,我希望能够为各个团队管理的服务器添加警报。

一个例子可能比我能解释的更清楚:

假设 Team-A 想要添加一些服务器以供 Prometheus 监控。此外,他们希望在某些情况下(内存不足、停机等)发出警报。

目前,通过我的设置,所有作业名称中的所有服务器都使用相同的规则集进行监视和警报。我想要的是这样的:

Docker-Servers 收到警报组警报-A
Nginx-Servers 收到警报组警报-B

我不确定要在 Prometheus.yml 和 alert.rules.yml 文件中做什么才能实现这一点。

任何帮助表示赞赏。

4

1 回答 1

2

我最终弄清楚了。

在 alertmanager 的 alert.rules.yml 文件中,您可以在“expr”行中指定正则表达式。

例如,如果我想监控服务器“test1”、“test2”、“test3”的停机时间,你可以执行以下操作:

expr: up{job=~"test1|test2|test3"} == 0
于 2018-10-11T16:13:50.230 回答