11

我正在测试 Azure Application Insights 警报功能。它似乎是错误的,或者我不知道如何使用它。

如果我根据指标“服务器异常”创建一个新警报,它似乎会工作一次然后再也不会。一旦它开火,它似乎会进入“活动”状态,其中有一个带有 ! 的橙色三角形。见下图。我创建了一个新的,我还没有触发,并且可以在图像中看到它有一个带勾号的绿色圆圈。

对我来说,这种暗示暗示在“确认”警报之前不会再次触发警报,这不是一个坏主意,但我不知道该怎么做。

在此处输入图像描述

编辑 :

我刚刚尝试按照建议使用“异常率”,但我认为触发警报的最低阈值是 5 分钟内平均每秒 1 个异常。

我必须说我的用例没有得到处理似乎很奇怪。我有一个轻量级的 Web API 服务,它非常简单,它永远不会失败,但它可能会失败,因此,如果发生异常,我想立即收到警报。

4

3 回答 3

7

当警报的条件不再满足时,警报应该解决并且状态应该恢复为绿色。使用“计数”指标很难实现这一点,因为它们会上升,几乎不会下降。这意味着,一旦触发,警报将无法解决,因为指标的值始终保持在阈值之上。

您可以尝试在“Rate”指标上设置警报,当“Rate”在您设置的限制范围内时,您应该会看到状态恢复为绿色。

于 2015-06-30T18:24:34.553 回答
3

现在已修复。如果您发现任何问题,请告诉我们。需要记住的一些事项:

  • 在滑动窗口上评估警报规则:从样本到达的那一刻起,警报将根据条件如何在滑动窗口上评估来触发/解决。
  • 关于基于异常计数的警报规则的上述警告:如果在规则中配置的时间窗口内没有报告异常,我们将解决警报。
  • 注意:这与基于度量的规则不同——缺少数据不会导致警报被解决。
于 2015-07-30T23:27:57.070 回答
1

“服务器异常”指标在 2018 年按 OP 的预期工作。我的用例如下:

For the goal of getting an email whenever an Exception happened.

使用“服务器异常”指标。

如果错误没有再次发生,该指标足够智能,可以在初始警报后等待一段时间后自动解决。

因此,您将获得最初的“警报”,然后 5 分钟后没有异常,它返回“健康”状态。

而且由于它是自动解决的,如果明天再次发生错误,它将再次发出“警报”。


请注意,这是将 App Insights 与 Function App 一起使用。Function App Failure 指标存在问题并且对此不可靠(Azure 保持记录 0.2 异常/秒并认为超过 5 分钟阈值中的 1...)

于 2018-09-12T20:30:48.407 回答