0

我已经设置了 Ganglia(Ganglia Core 3.6.0 和 Ganglia Web 3.5.10)来监控我的集群。

当 gmond 在机器中重新启动时,来自所有其他 gmond 机器的指标也会停止,即我无法在 Ganglia Web 中看到其他机器发布的指标。而且我还可以看到主机上升到 0,主机下降到 13(机器总数)。随着时间的推移,Hosts up 回到 13。

我错过了什么吗?有人能帮我吗...

4

1 回答 1

0

如果它总是同一台机器,它应该是一个 gmond '端点'。gmetad 守护进程只查询一个 gmond(无冗余),如果他宕机,似乎每个人都宕机了。如果存在冗余(例如,数据源中有多个主机),如果第一个主机由于超时前的 TCP 查询数量而关闭,您可能会出现一些延迟。

于 2013-10-24T07:14:24.063 回答