1

我想在 Google Cloud Monitoring 上添加一个警报,这样对于给定的主题和订阅,我想知道是否正在发布一个主题,然后订阅在给定的时间范围内没有以相同或相似的速率得到确认。

我们如何使用 Google Cloud Monitoring 或 StackDriver 中的警报来实现这一点?

我尝试了一种方法,我有两个条件要满足:

  1. 如果发布操作 > 0.016/秒持续 2 分钟(意味着每分钟至少发布一次)
  2. 如果订阅确认 < 0.001/sec 持续 2 分钟(如果 2 分钟内没有订阅确认发生)

然后,警觉。

这里发生的情况是,在低负载期间,如果在 3 分钟内没有发生发布并且发生了发布,则条件 1 和 2 都设置为 true,并且开发人员会收到有关此失败的警报。

那么,设计此类警报的正确方法是什么?

如果我的方法接近我想要的,接下来我想到的问题是,

  1. 有没有办法说从发布的实例开始计算你的两分钟,看看确认条件是否满足。
  2. 或者,有没有办法让警报等待 2-3 分钟以查看事件是否解决,然后向开发人员发送警报。
  3. 或者,有没有一种方法可以计算满足这些条件的出现次数,然后仅在 15 分钟内出现超过 5 或 10 次或类似情况时才发出警报。

对不起,很长的帖子。但是,任何形式的帮助都是值得赞赏的。

4

1 回答 1

0

为了计算任务的频率,使用 2-3 分钟的时间窗口。因此,如果您在 2 分钟或更长时间内有 0 个任务,则会再次出现此问题。这在有关部分指标的文档中进行了描述。此外,此链接中有解决方法。

您可以尝试创建自己的自定义指标

于 2018-01-19T09:30:14.637 回答