2

有没有人设置 Ganglia 在生产系统上收集指标?我们在亚马逊的 RHL 6.3 上使用 Ganglia 版本 3.1.7-3.el6(单播模式)和 RRD 工具 1.4.7-1.el6。

我们正面临重大的稳定性问题,Gmetad 似乎经常出现以下错误。

内核:gmetad [32277]:段错误在 4e47aa0a ip 00000037af00aee4 sp 00007fae22766230 错误 4 在 libganglia-3.1.7.so.0.0.0 [37af000000+14000]

这可能是因为我们使用了上述软件包的不兼容或旧版本。如果您在 RHL 生产设置上成功运行 Ganglia 并且没有任何问题,那么您使用的是什么版本的上述软件包?

4

1 回答 1

0

我面临着类似的问题。

此解决方案可能会有所帮助 -> Ganglia - gmetad - 进程被 SIGSEGV 终止

就我而言,要确定一个文件名 - 'part_max_used.rrd' 是 /path/to/ganglia/rrds/node_name 下的文件名,这是 SIGSEGV 的根本原因。删除文件后,gmetad 开始正常运行。

谢谢

于 2016-10-24T21:02:52.507 回答