我正在尝试通过以下警报通知已停止的容器:
alert: artifactory_down
expr: absent(container_memory_usage_bytes{name="artifactory"})
for: 1m
labels:
severity: critical
annotations:
description: Artifactory container is down for more than 60 seconds.
summary: Artifactory down
不幸的是,时间序列中存在导致错误警报的间隙。容器仍在运行。间隔在 1 到 5 分钟之间。
知道什么可能导致这种情况或如何进一步分析吗?