0

我希望 GCP 在我的一个云功能出现错误时发送警报,该云功能计划使用调度程序定期触发。我进入控制台并创建了一个看起来像这样的策略

控制台中的策略-简而言之,我正在监视云功能错误执行计数。如果错误计数超过 0 1 小时,我应该收到警报。

现在我的问题有两个。

  1. 基于上述条件,我有any time series violates above 0 for 1 hour. 如果我不关闭这些错误(可能是 30 天),即使该功能当前正在成功执行,我仍然会收到正确的警报吗?有没有办法只提醒 if MOST RECENT time series violates above 0 for 1 hour?如果是这样,我怎么能用 JSON 格式写这个?
  2. 上面显示的 GCP 监控警报策略的 JSON 模拟是什么?

我拼凑了可以在文档中找到的信息。这就是我到目前为止所拥有的。

{
  "conditions": [
    {
       "conditionThreshold": {
       "comparison": "COMPARISON_GT",
       "duration": "3600s",
       "filter": "metric.type=\"cloudfunctions.googleapis.com/function/execution_count" AND 
                  resource.type=\"cloud_function\" AND 
                  function_name=\"function-1\" AND
                  status=\"error\"",
       "thresholdValue": 0,
       "trigger": {
          "count": 1
        }
      }
    }
  ],
}

我是 StackExchange 的新手,所以如果我的问题格式不正确,请告诉我。非常感谢您的时间和帮助!

4

1 回答 1

1
  1. 一旦触发事件的条件不再成立,由警报策略导致的事件将自动解决。除非您只是想抑制进一步的通知,否则您不需要做任何事情来“关闭”错误,这就是“确认”的用途。没有可用的“最近”时间序列条件;您可能需要为每个功能创建单独的警报策略 - 而且您似乎已经在这样做了。

  2. 您认为这个 JSON 不正确是有原因的吗?我建议根据您遇到的问题提出问题,而不是在您自己完成之前要求其他人验证您的代码/工作。

于 2019-11-04T01:46:33.790 回答