0

我正在使用 Prometheus 和 Grafana 警报来监控 Linux 服务。我使用以下查询来获取所有正在运行的服务的计数,并在计数小于预期数量时发送警报。

services.count(node_systemd_unit_state{name=~"A.service|B.service|C.service", job="job1", state="active"} )

我想知道是否有任何方法可以找出哪个服务未运行(或正在运行的服务列表)作为警报的一部分。我正在使用电子邮件警报,它当前向我发送正在运行的服务计数。

4

0 回答 0