12

我正在尝试在 munin 中设置一些新主机进行监控。由于某种原因,它没有发生!

这是我到目前为止所尝试的。

在已经监控其他几台主机的 munin 服务器上,我在 /etc/munin/munin.conf 中添加了我想要的主机

[db1]
    address   10.10.10.25 # <- obscured the real IP address 
    use_node_name yes

在 db1 主机上,我在 /etc/munin/munin-node.conf 中设置了这个

host_name  db1.example.com
allow ^127\.0\.0\.1$
allow ^10\.10\.10\.26$
allow ^::1$
port 4949

我确保在两台机器上重新启动服务。

从监控主机我可以 telnet 到我想在 munin 端口上监控的新服务器:

[root@monitor3:~] #telnet db1.example.com 4949
Trying 10.10.10.26...
Connected to db1.example.com.
Escape character is '^]'.
# munin node at db1.example.com

等几分钟..什么也没有!新服务器不会出现在 munin 监控主机的 munin 仪表板中。

在 db1 主机(我要监控的主机)上的 /var/log/munin/munin-update.log 日志中,我发现:

2015/11/30 03:20:02 [INFO] starting work in 14199 for db1/10.10.10.26:4949.

2015/11/30 03:20:02 [FATAL] Socket read from db1 failed.  Terminating process. at /usr/share/perl5/vendor_perl/Munin/Master/UpdateWorker.pm line 254.

2015/11/30 03:20:02 [ERROR] Munin::Master::UpdateWorker<db1;db1> died with '[FATAL] Socket read from db1 failed.  Terminating process. at /usr/share/perl5/vendor_perl/Munin/Master/UpdateWorker.pm line 254.

这里会发生什么?我该如何解决这个问题?

4

1 回答 1

2

由于您已经验证了您的网络连接正常,作为调查的第一步,我肯定会简化munin-node.conf. 目前您有:

host_name  db1.example.com
allow ^127\.0\.0\.1$
allow ^10\.10\.10\.26$
allow ^::1$
port 4949

从这些我会删除:

  • host_name(这可能是多余的。)
  • IPv6 环回地址。(我认为您不需要它,但如果您确实需要它,您可以稍后再添加)
  • IPv4 环回地址。(同上)

allow如果它仍然无法正常工作,您可以通过将直接 IP 替换为以下内容来完全排除配置的任何问题:

cidr_allow 10.10.10.0/24

如果您的 db1 主机似乎是从不同的 IP 连接,这将允许从全范围的 IP 进行连接。

于 2016-02-16T18:49:02.353 回答