2

我期待第三部分工具/解决方案可以监控我的服务器的网络使用情况,以了解我的服务器资源(例如带宽)是否没有得到高度利用,如果是这样,我可以在我的服务器崩溃之前采取预防措施(例如调用我的辅助服务器来帮助负载共享等)。

目前我已经在我的 servlet 中编写了一个连续的 ping 逻辑,以便我的 2 台服务器(1 台作为主服务器,其他作为备份服务器)应该保持知道另一台服务器是否可用/不活动。

请为我当前的基于 ping 的服务器活力逻辑建议一些标准工具/解决方案。 请注意,我避免了集中管理所有服务器的解决方案,因为我构建了一个冗余系统,其中每个实例(服务器)都必须自己监控和通知

4

1 回答 1

1

Nagios 和 Ichinga 都是免费的开源监控软件系统,它们的工作方式大致相同。您可以集中或分布式地做事。

如果您使用相互 ping 来检查 web 应用程序的活跃度,您可能会感到失望。相反,您应该使用具有故障转移功能的负载平衡器正确地集群服务器。您可以使用 JMX 观察备份服务器上的活动:任何活动高峰都意味着主服务器已关闭(此外,您可以直接检测主服务器)。

至于要检查的值,启动jconsole您的 web 应用程序的开发实例并浏览您可以通过 JMX 观察到的各种数据。然后,或者使用类似的东西check_jmx(有一个或多个具有该名称的 Nagios 插件)或 Tomcat 的 JMXProxyServlet(Tomcat Manager webapp 的一部分)通过 HTTP 定期获取这些值。

我们使用 JMXProxyServlet + Nagios + 一些自定义脚本来读取来自 JXMProxyServlet 的响应,并将它们转换为 Nagios 能够理解的有意义的响应,它在多个服务器和环境中运行良好,采样了许多不同的值。

于 2012-07-04T20:33:07.380 回答