问题标签 [ganglia]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nagios - 集成 Nagios + Ganglia:未知主机名信息不可用。可能无效的主机名
我正在尝试使用此处描述的方法集成 Nagios 和 Ganglia 。在命令行中使用Ganglia Web Nagios 脚本check_heartbeat 时:
sh /var/www/html/ganglia/nagios/check_heartbeat.sh host=node-name threshold=50
输出:
OK Last beacon received 0 days, 0:00:00
但是在 Nagios UI 中,我收到的消息是,
UNKNOWN x.x.x.x - Hostname info not available. Likely invalid hostname
我在以下链接中发现了一些基于相同问题的讨论
- https://github.com/ganglia/monitor-core/issues/40
- http://sourceforge.net/p/ganglia/mailman/ganglia-general/thread/alpine.DEB.2.00.1205211147590.6484@localhost6.localdomain6/
由于我是 Ganglia 和 Nagios 的新手,他们没有给我解决问题的想法。
hadoop - Ganglia 监控 Hadoop 多节点集群
我想使用 ganglia 监控 Hadoop(Hadoop 版本-0.20.2)多节点集群。我的 Hadoop 工作正常。我在阅读以下博客后安装了 Ganglia ---
http://hakunamapdata.com/ganglia-configuration-for-a-small-hadoop-cluster-and-some-troubleshooting/
http://hokamblogs.blogspot.in/2013/06/ganglia-overview-and-installation-on.html
我还研究了使用 Ganglia.pdf 进行监控(附录 B Ganglia 和 Hadoop/HBase)。</p>
现在 Ganglia 只为所有节点提供系统指标(内存、磁盘等)。但它没有在 Web 界面上显示 Hadoop 指标(如 jvm、mapred 指标等)。我该如何解决这个问题?
amazon-web-services - ganglia vs sensu vs icinga vs nagios
我正在寻找在 AWS 下运行的主机和服务的监控工具。我们不是在寻找付费解决方案,但我们想运行一个监控服务器。在我们的云中,我们将启动和删除服务(Web 服务器、队列等)和主机。我想知道在每天添加/删除主机和服务时,哪种工具最适合监控它们?
我正在考虑 Ganglia、Nagios、Icinga 和 Sensu。只要它可以监控所描述的场景,任何其他未付费选项也是受欢迎的。
ganglia - 集群的一个节点未显示在 Ganglia 门户网站中
在 Ganglia 中,我配置了 2 个集群。集群 A 有 2 个节点,集群 B 分别有 13 个节点。集群 B 运行良好,而集群 A 仅显示 1 个节点。另一个节点具有完全相同的 gmond.conf 文件,如下所示:
qt-dw-master 上的 gmetad.conf 如下所示:
我尝试过使用多播,但不起作用。我也想找gmond的日志文件,但是失败了。任何人都可以帮助解决这个问题吗?
hadoop - 使用 Ganglia 监控 Hadoop-metrics2
我已经安装了 ganglia-3.6 并且想要使用它来监控所有的 hadoop-metrics。我已按照此处的说明进行操作:http : //www.abcn.net/2014/05/install-and-config-ganglia-on-cdh5.html 但看不到任何与 hadoop-metrics2 相关的图表。我可以看到有关主机的默认图表,例如磁盘使用情况、内存、CPU 等,但看不到任何与 hadoop-metrics 相关的图表。我正在使用 cloudera-5(CDH5)
ganglia - 解析和呈现来自 Ganglia 的数据
我刚刚开始使用神经节。
我也在神经节前端和图表上从客户那里获取数据。
但我得到的数据是原始的。它看起来像前端的键值。
有什么工具可以用来解析它并显示为仪表板吗?
我得到的数据主要是系统配置和性能
问候,
W
puppet - 安装在节点上的 puppetmaster 中下载
我是木偶的新手。
我已经在我的 puppet master 上下载了一个 ganglia repo。
如何在所有节点上安装这个 repo?
Master: ubuntu 14.04
Agent: 12.04
我想让 puppetmaster 服务器成为所需软件包的服务器。这样可以在没有 Internet 连接的节点上安装软件包
replication - Ganglia gmetad 故障转移
我想知道是否可以在故障转移/副本场景中使用 gmetad。我的问题如下:
我有 100 个节点,它们通过多播相互通信,并同步他们的 gmond 信息。我有一台单独的机器运行 gmetad(我们称之为 master1),它轮询来自各种 gmonds 的指标(到目前为止一切都很好)。
现在我想确定如果 master1 死了,我将拥有第二个 gmetad (master2),它具有相同的数据。所以我配置了第二个 gmetad 读取相同的 gmonds。现在,如果 master1 死亡并在(假设)3 天后再次出现,有没有办法从 master2 获取所有丢失的数据并在 master1 中有完整的时间线?
如果没有办法做到这一点,我可以使用 NFS 目录并将两个 gmetads 都指向同一目录中写入 rrds 吗?
cpu-usage - 如何解释 Ganglia cpu wio 图表
我试图了解我们系统的性能问题
CPU 等待 IO 说
最大为 255m,现在为 9.5m
这是什么 m ,如何解释统计数据