我已经开始使用 collectd (5.5.1)、statsd (git head)、influxd (1.2) 和 grafana 来监控我的基础架构。collectd 部分对于黑盒监控工作正常。我们想使用 statsd 进行白盒监控。
我们的设置是每台主机上的 collectd 和 statsd,将数据发送到监控主机上的 influxdb。Influxdb 和 grafana 运行在监控主机上。当然,collectd 和 statsd 也在监控主机上运行,就像它们在其他地方一样。
我在每个主机上的 statsd 配置很简单
{
graphitePort: 2003,
graphiteHost: "monitor.example.com",
port: 8125,
backends: [ "./backends/graphite" ]
}
这在任何情况下都可能并不理想,因为我刚刚发现有一个influxdb 后端可用,但我希望即使我可以做得更好,上述方法也能正常工作。
但是,我有以下问题:
statsd没有将主机信息转发到监控主机。
我知道 statsd 的好处之一是它可以在以指定的刷新间隔发送数据之前在本地主机上聚合数据。但是我没有在文档中看到在哪里指定,比如说,哪些指标被求和,哪些要发送最大值,哪些要发送什么百分位数等。
这些组件在过去一年中发展得如此迅速,以至于很多文档和教程都已经过时了,所以我很清楚我可能仅仅通过阅读错误的文档就做了一些不正确的事情。
我最近还发现了电报(在每个主机上运行?)。也许我对 statsd 有错误的期望(或者应该改用电报)?
我很乐意根据反馈使这个问题更具体。我知道我仍在为一些概念而苦苦挣扎。
非常感谢您的指点。