1

在这里,我尝试使用插件来检查服务是否运行,是否需要任何警告或任何关键操作,同时检查性能参数。

我们使用下面的插件来检查服务器是否处于活动状态并读取它的性能数据 JSON https://github.com/drewkerrigan/nagios-http-json

我正在尝试读取托管在http://localhost:8080/sample.json上的如下 JSON 文件

该插件在命令行上完美运行,它向我展示了所有可用的指标。

$:/usr/lib/nagios/plugins$ ./check_http_json.py -H localhost:8080 -p sample.json -m metrics.etp_count metrics.atc_count

OK: Status OK.|'metrics.etp_count'=101 'metrics.atc_count'=0 

但是当我在 Icinga2 配置中尝试相同的操作时,它并没有显示这个性能指标,虽然它没有给出任何错误,但同时它没有显示任何价值。

找到 JSON、Command.conf 和 Service.conf,如下所示。

{ 
 "metrics": {
    "etp_count": "0",
    "atc_count": "101",
    "mean_time": -1.0,
  }
}

下面是我的 commands.conf 和 services.conf

命令.conf

   /* Json Read Command */
object CheckCommand "json_check"{
import "plugin-check-command"
command = [PluginDir + "/check_http_json.py"]
arguments = {
"-H" = "$server_port$"
"-p" = "$json_path$"
"-w" = "$warning_value$"
"-c" = "$critical_value$"
"-m" = "$Metrics1$,$Metrics2$"
}
}

服务.conf

apply Service "json"{
        import "generic-service"

        check_command = "json_check"
        vars.server_port="localhost:8080"
        vars.json_path="sample.json"
        vars.warning_value="metrics.etp_count,1:100"
        vars.critical_value="metrics.etp_count,101:1000"
        vars.Metrics1="metrics.etp_count"
        vars.Metrics2="metrics.atc_count"

        assign where host.name == NodeName
}

有谁知道我们如何在 Command.conf 和 Service.conf 中传递多个值?

4

1 回答 1

0

我已经解决了这个问题。

我必须更改以下代码的插件文件“check_http_json.py”

def checkMetrics(self):
                """Return a Nagios specific performance metrics string given keys and parameter definitions"""
                metrics = ''
                warning = ''
                critical = ''
                if self.rules.metric_list != None:

                      for metric in self.rules.metric_list:

替换为

def checkMetrics(self):
                """Return a Nagios specific performance metrics string given keys and parameter definitions"""
                metrics = ''
                warning = ''
                critical = ''
                if self.rules.metric_list != None:

                        for metric in self.rules.metric_list[0].split():

实际上问题是列表没有正确处理,因此它无法遍历列表中的项目,由于 services.config 文件,它正在将其视为单个字符串。

必须进一步拆分才能获取 Metrics 字符串中的项目。

于 2016-06-09T09:49:44.840 回答