prometheus - 普罗米修斯统计查询

Question

我正在尝试使用 prometheus-grafana-alertmanager-blackbox_exporter 进行黑盒监控。我的问题是：我在一个集群中有很多实例。所以我把它标记为

probe_success{cluster="cluster-1", instance="instance-1"}

probe_success{cluster="cluster-1", instance="instance-2"}

现在我只想计算在最近 30m 的范围内，cluster-1 上的 probe_success 指标返回值 1 或 0 有多少次。Prometheus 真的不能做这件事吗？我找不到任何有关它的文档或问题

score 0 · Accepted Answer

您想要做的是随时间聚合。在您的情况下，它将是过去 30 分钟内指标的总和：

sum_over_time(probe_success[30m])

请注意，您正在计算的内容很难采取行动，因为它取决于过去 30 分钟内的刮擦次数。原因是如果 exporter 或 Prometheus 宕机（意味着没有生成指标）或者如果您更改 Prometheus 中的抓取间隔，则该值的含义将发生变化。

通常最好用它avg_over_time来表示应用程序在过去 30 分钟内可测量的时间百分比。

1 回答 1