我在普罗米修斯中有工作失败警报,它会在 2 小时后自行解决我收到警报实际上没有解决的警报。普罗米修斯是怎么解决的?请注意,这只发生在此工作警报中。
工作提醒:
- alert: Failed Job Status
expr: increase(kube_job_status_failed[30m]) > 0
for: 1m
labels:
severity: warning
annotations:
identifier: '{{ $labels.namespace }} {{ $labels.job_name }}'
description: '{{ $labels.namespace }} - {{ $labels.job_name }} Failed'
警报示例:
At 3:01 pm
[FIRING:1] Failed Job Status @ <environment-name> <job-name>
<environment-name> - <job-name> Failed
At 5:01 pm
[RESOLVED]
Alerts Resolved:
- <environment-name> - <job-name>: <environment-name> - <job-name> Failed
这是相关的 pod,因为可以看出似乎没有任何问题得到解决。
提前感谢您的帮助!
