1

我正在尝试将 Nagios-NRPE 支票变成 Check_MK 支票。第一个是:

check_procs -w 10 -c 15 -C crond

我的尝试是使用该State and coung processes规则,但它总是会引发严重警报。我的规则的参数是(从rules.mk配置文件中提取的):

'process': 'crond'
'okmax':   10
'okmin':    1
'warnmax': 15
'warnmin': 11

由于 WATO 配置屏幕没有说明关键阈值,我猜测超出这些阈值的值会引发严重警报。

我的问题是:当此规则处于活动状态时,即使找到的进程数在 OK 阈值内,也会发出严重警报

Status detail警报是

CRIT - 7 processes (ok from 1 to 15)CRIT 1620.6 MB virtual, 28.2 MB resident, 2.7% CPU

然后,我无法理解这种行为,我觉得我误解了 check_MK 阈值参数或者我遗漏了一些东西。

你能帮助我吗?

提前谢谢。

4

1 回答 1

1

正如我在上一段问题中所怀疑的那样,我误解了 check_MK 阈值参数。

这些是在以下位置找到的 python 代码行~/share/check_mk/checks/ps

state = 0
if count > params["warnmax"] or count < params["warnmin"]:
    state = 2
    infotext += " (ok from %d to %d)(!!)" % (params["okmin"], params["okmax"])
elif count > params["okmax"] or count < params["okmin"]:
    state = 1
    infotext += " (ok from %d to %d)(!)" % (params["okmin"], params["okmax"])

因此,任何低于此值的值warnmin都会引发严重警报。因此,为了防止这种情况,间隔必须包括一个。在我的示例中,应降低该值以匹配该值。warn okwarminokmin

'process': 'crond'
'okmax':   10
'okmin':    1
'warnmax': 15
'warnmin':  1

在数学术语中,ok区间必须是 1 的子区间warn

我错误地猜测这些间隔不应该重叠,但实际上它们必须重叠。

于 2017-10-03T06:23:29.800 回答