嗨,我刚刚构建了我的 Zabbix 服务器,并且正在配置当前在 Nagios 中设置的一些检查。
其中一项检查是 check_load。谁能解释这个检查在 Nagios 中的含义以及我如何在 Zabbix 中复制它。
在 Nagios 中 check_load 监控服务器负载。服务器负载很好地表明了您的整体利用率:http://en.wikipedia.org/wiki/Load_(computing)
您可以使用 top 命令在大多数 *nix 服务器上轻松查看服务器负载。右上角的 3 个数字显示了 1、5 和 15 分钟的平均负载。作为简要指南,负载应小于您的处理器数量。因此,例如,如果您有一个 4 cpu 服务器,那么我希望您的平均负载低于 4.00。
我最近为http://www.dataloop.io做了一个 nagios 脚本格式的快速负载监控器
它完成得很快,需要相当多的工作才能跨其他系统工作。但它给人一种如何抓取 top 输出的感觉:
#!/bin/bash
onemin=$(top -b -n1 | sed -n '1p' | cut -d ' ' -f 13 | sed 's/%//')
fivemin=$(top -b -n1 | sed -n '1p' | cut -d ' ' -f 14 | sed 's/%//')
fifteenmin=$(top -b -n1 | sed -n '1p' | cut -d ' ' -f 15 | sed 's/%//')
int_fifteenmin=$( printf "%.0f" $fifteenmin )
echo "OK | 1min=$onemin;;;; 5min=$fivemin;;;; 15min=$fifteenmin;;;;"
alert=10
if [ "$int_fifteenmin" -gt "$alert" ]
then
exit 2
fi
exit 0
希望这足以解释您创建 Zabbix 等价物。
在 zabbix 中,它是一个 zabbix 代理内置检查。在此处搜索 system.cpu.load 。
至于它测量的内容,已经发布的维基百科文章链接是一个很好的阅读。