我有一个 Apache + Haproxy + Mongrel 集群设置。当我的 Mongrel 队列长度太长时,我想收到警报。
如何获取当前的 Mongrel 队列长度并使其可用于 Monit 和 Nagios 等警报工具?
我知道 Haproxy 有关于 Mongrel 队列的信息,因为它智能地向集群中最不忙的 Mongrel 发送请求。我想知道它是如何发现的?当这种情况到来时,我需要一个类似的机制来生成警报和/或重新启动杂种。
我有一个 Apache + Haproxy + Mongrel 集群设置。当我的 Mongrel 队列长度太长时,我想收到警报。
如何获取当前的 Mongrel 队列长度并使其可用于 Monit 和 Nagios 等警报工具?
我知道 Haproxy 有关于 Mongrel 队列的信息,因为它智能地向集群中最不忙的 Mongrel 发送请求。我想知道它是如何发现的?当这种情况到来时,我需要一个类似的机制来生成警报和/或重新启动杂种。
将此添加到您的 haproxy 配置中
stats uri /haproxy/hastats
然后使用 lynx 获取如下统计信息:(假设 haproxy 在端口 10000 上运行 - 调整以适应)
lynx --dump http://my-server:10000/haproxy/hastats
每个 haproxy 配置文件中的每个服务器条目都会有一行,告诉您它是向上还是向下,它的队列有多长,如下所示:
Server Queue Sessions Errors
Name Weight Status Act. Bck. Curr. Max. Curr. Max. Limit Cumul. Conn. Resp. Sec. Check Down
primary 1 UP Y - 0 0 68 386 - 134385861 207 699 0 7028 150
secondary 1 UP Y - 0 0 71 248 - 134464984 216 551 0 7129 98
现在您只需要一个脚本来获取当前队列(第 6 列)并将其输入 nagios,然后您就离开了!
New Relic 的 RPM 产品 (www.newrelic.com) 维护有关 Mongrel 队列长度的信息。他们有一个 API,您可以使用它来获得关于队列长度的近乎实时的反馈并相应地调整负载平衡。
您可以在以下网址获取有关 API 的更多信息:https ://newrelic.tenderapp.com/faqs/docs/data-api
希望这能提供一些帮助。