我正在寻找一个监视器来负责跟踪一堆不同的虚拟机(几乎总是基于 ubuntu)。我计划通过发送请求进行测试,以及测试某些服务是否在特定的 VM 上运行(这可能需要某种 ssh 组件?)。此数据将通过 REST API 发送到 cachethq 实例。
我将监控的一些服务包括:Jira、Confluence、Jenkins(和从节点),以及其他一些 Atlassian 套件产品。
我正在考虑用 python 写一些东西来做到这一点。有没有人有其他更好的建议?
谢谢
我正在寻找一个监视器来负责跟踪一堆不同的虚拟机(几乎总是基于 ubuntu)。我计划通过发送请求进行测试,以及测试某些服务是否在特定的 VM 上运行(这可能需要某种 ssh 组件?)。此数据将通过 REST API 发送到 cachethq 实例。
我将监控的一些服务包括:Jira、Confluence、Jenkins(和从节点),以及其他一些 Atlassian 套件产品。
我正在考虑用 python 写一些东西来做到这一点。有没有人有其他更好的建议?
谢谢
假设您设置了执行您描述的所有监控的监控服务器。然后你的监控服务器离线。你将如何发现?
解决这个递归监控问题将花费您比您可能估计的更多的时间,这就是为什么构建自己的监控解决方案几乎没有意义的原因。
我会使用一个便宜的灵活的正常运行时间监视器(我偏爱https://wdt.io),在你的虚拟机上设置 cron 作业来测试你的服务,然后在正常运行时间监视器上卷曲一个唯一的 URL。如果服务关闭,则不会发生卷曲,并且监视器会提醒您。
那些带有 web gui 的服务,您可以通过正常运行时间监控器定期 ping 相应的 URL 来直接监控。
根据我的经验,我认为有必要进行内部虚拟机监控(监控应用程序、端口状态、主机活动、CPU、RAM ......)以及通过用户体验(硒)和远程检查进行外部监控。所有这些信息都可以通过脚本或远程执行来提取,但是当有应用程序为我们提供所有这些信息时,为什么我们还要处理它呢?您可以找到社区应用程序,如 Pandora FMS ( http://pandorafms.org/en/features/monitoring-software/ ) 和可用的软件代理,您可以自动提取所有系统信息,并通过简单的命令获取 Jira、Confuence.. 。 地位。它还允许您向所有这些虚拟机添加自定义脚本和远程检查...检查一下
Nagios 是一个灵活且可扩展的基础设施监控工具。它允许您编写自己的脚本来检查您需要检查的任何内容。
我相信有一个带有 UI 的付费版本,但你可以有一个免费的 IIRC 基本版本。