0

我有一个 HPC 集群,我想用 Icinga2 监控它的运行状况。我为集群中的每个节点定义了许多检查,但我真正想要的是在超过一定百分比的节点生病时收到通知。

我注意到可以定义一个代表集群的虚拟主机并使用 Icinga 域特定语言来实现我感兴趣的东西(http://docs.icinga.org/icinga2/latest/doc/module/icinga2/章节/高级主题?highlight-search=up_count#access-object-attributes-at-runtime)。然而,这似乎是一个不雅且尴尬的解决方案。

是否可以在主机组上定义这种“聚合”或“元检查”?

4

1 回答 1

0

没有任何解决方案,文档中的这样一个东西帮助了很多用户,即使它不是那么优雅。诸如业务流程之类的外部插件可以做同样的事情,但需要额外的配置。例如,Vagrant box 集成了 Icinga Web 2 模块。

其他用户倾向于为此使用 check_multi 或 check_cluster。是不是也很优雅。

尽管这个想法很好并且可以持续很长时间,但目前还没有实施此类功能的计划。

于 2016-08-15T20:17:46.033 回答