1

我有十几个负载平衡的云服务器,都由 Munin 监控。

我可以单独跟踪每一个就好了。但我想知道我是否可以以某种方式将它们捆绑在一起,以查看整个云集群中有多少集体 CPU 使用率(例如)。

我怎样才能做到这一点?

munin.conf 文件可以很容易地为子域处理此问题,但我不确定如何为简单的 Web 节点配置它。假设我的 web 节点被命名为 web_node_1 - web_node_10。

我的 conf 现在看起来像这样:

[web_node_1]
    address 10.1.1.1
    use_node_name yes
...
[web_node_10]
    address 10.1.1.10
    use_node_name yes

非常感谢您的帮助。

4

1 回答 1

0

您可以使用sumstack来实现这一点。

我只需要做同样的事情,我发现这篇文章很有帮助。

本质上,您想要执行以下操作:

[web_nodes;Aggregated]
   update no

   cpu_aggregate.update no
   cpu_aggregate.graph_args --base 1000 -r --lower-limit 0 --upper-limit 200
   cpu_aggregate.graph_category system
   cpu_aggregate.graph_title Aggregated CPU usage
   cpu_aggregate.graph_vlabel %
   cpu_aggregate.graph_order system user nice idle
   cpu_aggregate.graph_period second
   cpu_aggregate.user.label user
   cpu_aggregate.nice.label nice
   cpu_aggregate.system.label system
   cpu_aggregate.idle.label idle
   cpu_aggregate.user.sum web_node_1:cpu.user web_node_2:cpu.user
   cpu_aggregate.nice.sum web_node_1:cpu.nice web_node_2:cpu.nice
   cpu_aggregate.system.sum web_node_1:cpu.nice web_node_2:cpu.system
   cpu_aggregate.idle.sum web_node_1:cpu.nice web_node_2:cpu.idle

还有一些其他的东西可以调整图形以使其具有与主插件相同的比例、最小/最大等,这些可以从“cpu”插件文件中复制。这里的关键是最后四行——这是其他图表中值的总和。

于 2012-06-04T17:42:33.033 回答