0

我在 Nagios Exchange 站点上找到了一项服务检查,它适用于小型目录,但不适用于需要超过 30 或 60 秒才能完成的大型目录。

http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/CheckDirSize/details

我遇到的问题是我需要配置一个服务检查,Nagios 可以每天运行一次,但会保持打开 1440 分钟(一天)。目录列表很大,需要很多小时才能完成(最多 20 小时)。

这是我的服务检查(每天检查,使用 nrpe 时,超时为 86400 秒,也是一天)。但是由于某种原因,即使我可以看到 du -sk 在 ps -ef | 的命令行上运行 grep du,Nagios 报告“(服务检查超时)”:

define service {
    use                             generic-service,srv-pnp
    host_name                       IMAGEServer1
    service_description             Images
    check_command                   check_nrpe!check_dirsize -t 86400
    check_interval                  1440
    }

在我的 linux 服务器上的 nrpe.cfg 文件中,我也有这两个指令:

command_timeout=86400
connection_timeout=86400

如何让 Nagios 完成检查而不超时?我的印象是我上面的指令是正确的。

4

1 回答 1

1

超时的是check_nrpe本地的命令(默认超时为 2 分钟)。您可以编辑其命令定义以使用长超时。

或者,您可能希望将此作为对 IMAGEServer1 的被动检查,作为 cron 作业运行。

于 2013-05-21T01:04:02.117 回答