0

我正在尝试通过以下警报通知已停止的容器:

alert: artifactory_down
expr: absent(container_memory_usage_bytes{name="artifactory"})
for: 1m
labels:
  severity: critical
annotations:
  description: Artifactory container is down for more than 60 seconds.
  summary: Artifactory down

不幸的是,时间序列中存在导致错误警报的间隙。容器仍在运行。间隔在 1 到 5 分钟之间。

在此处输入图像描述

知道什么可能导致这种情况或如何进一步分析吗?

4

1 回答 1

0

我猜您使用的是旧版本的 cAdvisor,请确保您至少运行 0.27.4 以进行我为标签一致性所做的修复。up还要通过度量为 1检查 cAdvisor 的刮擦是否成功。

于 2018-05-07T11:32:26.163 回答