一直在网上和论坛上翻滚,找不到这方面的资源。
我要实现的是在一段时间内数据没有变化时创建警报。
我们正在监控我们的网络服务器的打开文件,所以这个数字经常波动。请注意,当数字停滞不前时,它指向服务器上的问题。所以我们想要的是如果 openfile 保持 X 2 分钟提醒我们。
一直在网上和论坛上翻滚,找不到这方面的资源。
我要实现的是在一段时间内数据没有变化时创建警报。
我们正在监控我们的网络服务器的打开文件,所以这个数字经常波动。请注意,当数字停滞不前时,它指向服务器上的问题。所以我们想要的是如果 openfile 保持 X 2 分钟提醒我们。
我通过一连串的事情发出了这样的警告:
avg_over_time(delta(Sensor_Data[1m])[20s:])
- 这计算 'first_value-last_value of 1min interval' 的 20 秒平均值Sensor_Data
因此,如果值在大约 2-3 分钟内没有变化,Grafana 会发送警报。
这对我有用。确保您使用的是 rate 或 increase 函数(没有变化意味着它将降至零)并过滤查询,如下所示:
increase(metric_name) > 0
然后,在警报配置中,将“如果没有数据或所有值都为空”设置为“警报”。这样,当没有数据时,就会触发警报。
如果您确实使用 Prometheus 和警报管理器,那么有一个很好的功能对我有用。
因此,如果时间间隔没有变化,在警报管理器中使用类似的东西将触发
changes(metric_name[5m]) = 0