我想在 Google Cloud Monitoring 上添加一个警报,这样对于给定的主题和订阅,我想知道是否正在发布一个主题,然后订阅在给定的时间范围内没有以相同或相似的速率得到确认。
我们如何使用 Google Cloud Monitoring 或 StackDriver 中的警报来实现这一点?
我尝试了一种方法,我有两个条件要满足:
- 如果发布操作 > 0.016/秒持续 2 分钟(意味着每分钟至少发布一次)
- 如果订阅确认 < 0.001/sec 持续 2 分钟(如果 2 分钟内没有订阅确认发生)
然后,警觉。
这里发生的情况是,在低负载期间,如果在 3 分钟内没有发生发布并且发生了发布,则条件 1 和 2 都设置为 true,并且开发人员会收到有关此失败的警报。
那么,设计此类警报的正确方法是什么?
如果我的方法接近我想要的,接下来我想到的问题是,
- 有没有办法说从发布的实例开始计算你的两分钟,看看确认条件是否满足。
- 或者,有没有办法让警报等待 2-3 分钟以查看事件是否解决,然后向开发人员发送警报。
- 或者,有没有一种方法可以计算满足这些条件的出现次数,然后仅在 15 分钟内出现超过 5 或 10 次或类似情况时才发出警报。
对不起,很长的帖子。但是,任何形式的帮助都是值得赞赏的。