我协助维护基于 Web 的企业系统(在 J2EE 中编程,但这是一个更普遍的问题),我想知道:有哪些好的工具可以衡量企业系统的“健康状况”?例如,检查服务器上的内存空间、检查批处理运行状态、在一定时间内处理的记录数等工具?
我不希望将其限制为每个答案一个工具,但是,每个答案多个工具当然是可以接受的。
我协助维护基于 Web 的企业系统(在 J2EE 中编程,但这是一个更普遍的问题),我想知道:有哪些好的工具可以衡量企业系统的“健康状况”?例如,检查服务器上的内存空间、检查批处理运行状态、在一定时间内处理的记录数等工具?
我不希望将其限制为每个答案一个工具,但是,每个答案多个工具当然是可以接受的。
OpenNMS是一个不错的监控工具。开箱即用,它可以监控服务器的各个方面,主要是内存、网络使用情况、磁盘空间等。但它是开源的,可以扩展以监控其他事物。
我们用它来监控数以千计的服务。它非常擅长它的工作。
它可能不太适合处理的记录数量,至少我们不会那样使用它。
我们使用Nagios
我会提供更多细节,但我们的管理员设置了它,所以希望有人可以在评论中提供更多信息。我所知道的是,我们用它来托管几个客户网站,这些网站相当大,流量也很大。它工作得非常好。
+1 为 OpenNMS。除了开箱即用的系统级监控之外,它还可以使用 JMX 轻松扩展,因此您的应用程序可以将其内部结构公开为 JMX 属性,OpenNMS 可以监控它们、绘制图表、基于它们发出警报,等等
我们还扩展了 OpenNMS 以在出现问题时发送 SMS 警报。