问题标签 [ganglia]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
401 浏览

nagios - 集成 Nagios + Ganglia:未知主机名信息不可用。可能无效的主机名

我正在尝试使用此处描述的方法集成 Nagios 和 Ganglia 。在命令行中使用Ganglia Web Nagios 脚本check_heartbeat 时:

sh /var/www/html/ganglia/nagios/check_heartbeat.sh host=node-name threshold=50

输出: OK Last beacon received 0 days, 0:00:00

但是在 Nagios UI 中,我收到的消息是,

UNKNOWN x.x.x.x - Hostname info not available. Likely invalid hostname

我在以下链接中发现了一些基于相同问题的讨论

由于我是 Ganglia 和 Nagios 的新手,他们没有给我解决问题的想法。

0 投票
2 回答
1553 浏览

hadoop - Ganglia 监控 Hadoop 多节点集群

我想使用 ganglia 监控 Hadoop(Hadoop 版本-0.20.2)多节点集群。我的 Hadoop 工作正常。我在阅读以下博客后安装了 Ganglia ---

http://hakunamapdata.com/ganglia-configuration-for-a-small-hadoop-cluster-and-some-troubleshooting/

http://hokamblogs.blogspot.in/2013/06/ganglia-overview-and-installation-on.html

我还研究了使用 Ganglia.pdf 进行监控(附录 B Ganglia 和 Hadoop/HBase)。​</p>

现在 Ganglia 只为所有节点提供系统指标(内存、磁盘等)。但它没有在 Web 界面上显示 Hadoop 指标(如 jvm、mapred 指标等)。我该如何解决这个问题?

0 投票
2 回答
1232 浏览

amazon-web-services - ganglia vs sensu vs icinga vs nagios

我正在寻找在 AWS 下运行的主机和服务的监控工具。我们不是在寻找付费解决方案,但我们想运行一个监控服务器。在我们的云中,我们将启动和删除服务(Web 服务器、队列等)和主机。我想知道在每天添加/删除主机和服务时,哪种工具最适合监控它们?

我正在考虑 Ganglia、Nagios、Icinga 和 Sensu。只要它可以监控所描述的场景,任何其他未付费选项也是受欢迎的。

0 投票
1 回答
214 浏览

cluster-computing - 我的神经节不在集群上工作,所以我想使用扭矩监控作业

ganglia不在集群上工作,所以我想使用torque监控作业。我可以通过扭矩监控所有工作,即使不是通过扭矩提交的工作?

0 投票
1 回答
934 浏览

ganglia - 集群的一个节点未显示在 Ganglia 门户网站中

在 Ganglia 中,我配置了 2 个集群。集群 A 有 2 个节点,集群 B 分别有 13 个节点。集群 B 运行良好,而集群 A 仅显示 1 个节点。另一个节点具有完全相同的 gmond.conf 文件,如下所示:

qt-dw-master 上的 gmetad.conf 如下所示:

我尝试过使用多播,但不起作用。我也想找gmond的日志文件,但是失败了。任何人都可以帮助解决这个问题吗?

0 投票
1 回答
901 浏览

hadoop - 使用 Ganglia 监控 Hadoop-metrics2

我已经安装了 ganglia-3.6 并且想要使用它来监控所有的 hadoop-metrics。我已按照此处的说明进行操作:http : //www.abcn.net/2014/05/install-and-config-ganglia-on-cdh5.html 但看不到任何与 hadoop-metrics2 相关的图表。我可以看到有关主机的默认图表,例如磁盘使用情况、内存、CPU 等,但看不到任何与 hadoop-metrics 相关的图表。我正在使用 cloudera-5(CDH5)

0 投票
0 回答
112 浏览

ganglia - 解析和呈现来自 Ganglia 的数据

我刚刚开始使用神经节。

我也在神经节前端和图表上从客户那里获取数据。

但我得到的数据是原始的。它看起来像前端的键值。

有什么工具可以用来解析它并显示为仪表板吗?

我得到的数据主要是系统配置和性能

问候,

W

0 投票
1 回答
33 浏览

puppet - 安装在节点上的 puppetmaster 中下载

我是木偶的新手。

我已经在我的 puppet master 上下载了一个 ganglia repo。

如何在所有节点上安装这个 repo?

Master: ubuntu 14.04

Agent: 12.04

我想让 puppetmaster 服务器成为所需软件包的服务器。这样可以在没有 Internet 连接的节点上安装软件包

0 投票
1 回答
117 浏览

replication - Ganglia gmetad 故障转移

我想知道是否可以在故​​障转移/副本场景中使用 gmetad。我的问题如下:

我有 100 个节点,它们通过多播相互通信,并同步他们的 gmond 信息。我有一台单独的机器运行 gmetad(我们称之为 master1),它轮询来自各种 gmonds 的指标(到目前为止一切都很好)。

现在我想确定如果 master1 死了,我将拥有第二个 gmetad (master2),它具有相同的数据。所以我配置了第二个 gmetad 读取相同的 gmonds。现在,如果 master1 死亡并在(假设)3 天后再次出现,有没有办法从 master2 获取所有丢失的数据并在 master1 中有完整的时间线?

如果没有办法做到这一点,我可以使用 NFS 目录并将两个 gmetads 都指向同一目录中写入 rrds 吗?

0 投票
0 回答
891 浏览

cpu-usage - 如何解释 Ganglia cpu wio 图表

我试图了解我们系统的性能问题

CPU 等待 IO 说

最大为 255m,现在为 9.5m

这是什么 m ,如何解释统计数据