0

我正在尝试使用 prometheus-grafana-alertmanager-blackbox_exporter 进行黑盒监控。我的问题是:我在一个集群中有很多实例。所以我把它标记为

probe_success{cluster="cluster-1", instance="instance-1"}

probe_success{cluster="cluster-1", instance="instance-2"}

现在我只想计算在最近 30m 的范围内,cluster-1 上的 probe_success 指标返回值 1 或 0 有多少次。Prometheus 真的不能做这件事吗?我找不到任何有关它的文档或问题

4

1 回答 1

0

您想要做的是随时间聚合。在您的情况下,它将是过去 30 分钟内指标的总和:

sum_over_time(probe_success[30m])

请注意,您正在计算的内容很难采取行动,因为它取决于过去 30 分钟内的刮擦次数。原因是如果 exporter 或 Prometheus 宕机(意味着没有生成指标)或者如果您更改 Prometheus 中的抓取间隔,则该值的含义将发生变化。

通常最好用它avg_over_time来表示应用程序在过去 30 分钟内可测量的时间百分比。

于 2020-02-13T12:48:20.510 回答