0

嗨,我刚刚构建了我的 Zabbix 服务器,并且正在配置当前在 Nagios 中设置的一些检查。

其中一项检查是 check_load。谁能解释这个检查在 Nagios 中的含义以及我如何在 Zabbix 中复制它。

4

2 回答 2

3

在 Nagios 中 check_load 监控服务器负载。服务器负载很好地表明了您的整体利用率:http://en.wikipedia.org/wiki/Load_(computing)

您可以使用 top 命令在大多数 *nix 服务器上轻松查看服务器负载。右上角的 3 个数字显示了 1、5 和 15 分钟的平均负载。作为简要指南,负载应小于您的处理器数量。因此,例如,如果您有一个 4 cpu 服务器,那么我希望您的平均负载低于 4.00。

我最近为http://www.dataloop.io做了一个 nagios 脚本格式的快速负载监控器

它完成得很快,需要相当多的工作才能跨其他系统工作。但它给人一种如何抓取 top 输出的感觉:

#!/bin/bash
onemin=$(top -b -n1 | sed -n '1p' | cut -d ' ' -f 13 | sed 's/%//')
fivemin=$(top -b -n1 | sed -n '1p' | cut -d ' ' -f 14 | sed 's/%//')
fifteenmin=$(top -b -n1 | sed -n '1p' | cut -d ' ' -f 15 | sed 's/%//')

int_fifteenmin=$( printf "%.0f" $fifteenmin )

echo "OK | 1min=$onemin;;;; 5min=$fivemin;;;; 15min=$fifteenmin;;;;"

alert=10

if [ "$int_fifteenmin" -gt "$alert" ]
then
  exit 2
fi

exit 0

希望这足以解释您创建 Zabbix 等价物。

于 2013-10-23T17:27:06.613 回答
2

在 zabbix 中,它是一个 zabbix 代理内置检查。在此处搜索 system.cpu.load 。

至于它测量的内容,已经发布的维基百科文章链接是一个很好的阅读。

于 2013-10-24T05:50:44.397 回答