0

我们有一些在 Windows 2K、2008 服务器上运行的应用程序。它们是用java编写的。这些应用程序需要执行许多自动化任务。我们很难监控这些应用程序。有时由于 XYZ 原因,应用程序挂起或无法执行所需的工作。几天后,当有人报告所需的功能尚未执行时,我们才知道这一点。为了解决这个问题,我们为每个 imp 例外添加了电子邮件,但是开发人员需要每天花时间检查这 1000 封电子邮件。这又不是可行且有效的解决方案。

现在我们正在寻找一个警报、警报、通知显示和监控系统。我们需要有一个远程应用程序,它可以从这些 java 应用程序接收警报,然后根据某些信息/条件/配置,远程应用程序可以在屏幕上显示一些红色、橙色、绿色文本。根据红色文字,用户可以直观地看到系统存在问题。如果需要,可以通知用户应用程序中存在严重问题。

请帮助我们确定实现这一目标的任何现有机制、工具、包。任何建议将不胜感激。

谢谢

4

2 回答 2

0

我会结合使用 check_logfiles 插件来解析日志异常并引发警报,并结合使用 check_jmx/jmxquery 来检查 JVM 内的指标,例如堆使用率和线程数。

check_logfiles

check_jmx

于 2013-06-17T08:05:57.633 回答
0

有无数种方法可以实现这一目标,但所有方法都需要付出一些努力。采取哪种方式取决于您的需求和能力。我想到了几个选择:

  • 让您的进程将它们的异常记录到在某个中央服务器上运行的 Syslog 守护程序。然后,您可以让管理员通读日志文件以查找严重问题,但是有很多方法可以对系统日志消息进行后处理,对其进行网络搜索可能会提供更多提示。
  • 有什么方法可以在登录服务器时观察进程是否正常运行?您可以在服务器上安装 Nagios 之类的东西,然后编写一个插件来监视所有服务器上的特定进程。该插件基本上可以是一个检查“ps”的shell脚本,或者一个日志文件,或者任何你想要的。如果您在 IT 部门,您的组织可能已经有一些类似这样的系统 (NMS)。
  • 我不确定为什么这个问题被标记为“snmp”,但在技术上可以在每台服务器上安装一个 SNMP 代理,并让它们在特定条件下发送陷阱。我确实认为这有点矫枉过正,因为您还必须获得一个好的 SNMP 管理器来接收陷阱并提醒系统管理员。
于 2013-06-13T08:03:18.887 回答