这里的想法是我正在考虑对一个指标发出警报,该指标证实了另一个工具正在监控的指标。例如:我可能有一个服务通过提供队列来执行某些任务,当处理的任务降为零时,需要触发警报。另一项服务是监控队列何时没有缩小,基本上是从发送方检测请求没有被处理,然后它也需要触发。
但是,我想避免两个警报。过多的噪音会影响 MTTR。有没有办法可以避免第二个警报,加入警报,或者在单个警报中提及另一个警报。最后一个有点像将异常/错误包装在另一个异常/错误中,如果可能的话,也可能是我的首选方法。
是否可以根据另一个人是否在开火来有条件地向 Prometheus 发出警报?