1

一直在网上和论坛上翻滚,找不到这方面的资源。

我要实现的是在一段时间内数据没有变化时创建警报。

我们正在监控我们的网络服务器的打开文件,所以这个数字经常波动。请注意,当数字停滞不前时,它指向服务器上的问题。所以我们想要的是如果 openfile 保持 X 2 分钟提醒我们。

4

3 回答 3

2

我通过一连串的事情发出了这样的警告:

  1. 对于所有警报,我都有一个独家的“警报虚拟板”,因为每个图表只能有一个警报(grafana 版本 6.6.0)
  2. 我使用以下查询:avg_over_time(delta(Sensor_Data[1m])[20s:])- 这计算 'first_value-last_value of 1min interval' 的 20 秒平均值
  3. 我的数据收集程序输入prometheus,然后输入grafana——如果这个程序冻结,它可能会继续将最后一个值发送给prometheus,上面的查询将严格降为零。
  4. 所以我有一个警报,如果上述查询在一个范围内(-0.01, 0.01)一分钟(上述查询在系统运行时的典型值是 abs(query) > 0.18)

Sensor_Data因此,如果值在大约 2-3 分钟内没有变化,Grafana 会发送警报。

于 2020-05-24T19:53:44.600 回答
0

这对我有用。确保您使用的是 rate 或 increase 函数(没有变化意味着它将降至零)并过滤查询,如下所示:

increase(metric_name) > 0

然后,在警报配置中,将“如果没有数据或所有值都为空”设置为“警报”。这样,当没有数据时,就会触发警报。

于 2018-11-08T18:09:12.200 回答
0

如果您确实使用 Prometheus 和警报管理器,那么有一个很好的功能对我有用。

变化

因此,如果时间间隔没有变化,在警报管理器中使用类似的东西将触发 changes(metric_name[5m]) = 0

于 2022-02-25T14:00:54.803 回答