我想在最近的 cronjob 作业失败时收到警报。expr
kube_job_status_failed{job_name=~"cronjobname.*"}==1
大部分时间都有效。但是如果一个作业失败并保留,即使下一个作业成功,我仍然会收到警报,因为prometheus中有两条记录,一条是失败记录,另一条是成功记录。
我发现我可以从中获取最新的作业时间戳kube_cronjob_status_last_schedule_time{cronjob="cronjobname"}
,然后用于kube_job_status_failed{job_name="cronjobname-TIMESTAMP"}
查询最后的作业状态。
我想知道我们是否有办法在一个查询中连接第一个查询jobname
的结果并在第二个查询中过滤?喜欢
kube_job_status_failed{job_name=string_concatenate("cronjobname-", kube_cronjob_status_last_schedule_time{cronjob="cronjobname"})}