2

我想检查某个指标是否在 5 分钟内在普罗米修斯中不可用。

我正在使用缺席(K_KA_GCPP)并给出 5 分钟的阈值。但似乎我无法在某些标签(如站点 ID)上对缺少的功能进行分组。

如果指标不适用于所有 4 个站点 ID,则 Absent 有效。我想了解所有 4 个站点 ID 中的 1 个站点 ID 的指标是否不可用或不存在,并且我不想在查询中对站点 ID 标签进行硬编码,它应该是通用的。有什么办法可以做到吗?

4

1 回答 1

1

我能够通过这样做来实现这一点:

count(up{job="prometheus"} offset 1h) by (project) unless count(up{job="prometheus"} ) by (project)

如果该指标在过去 1 小时内丢失,则会触发警报。您可以在该by部分之后添加您需要的任何标签(例如,这有助于更改)。

资料来源:Prometheus 缺少指标和标签的警报

于 2020-10-08T16:12:45.263 回答