0

我们有一个石墨全栈服务器,它接收来自不同机器的指标。当其他 collectd 客户端发送数据正常时,其中一个客户端出现以下错误:

1 月 29 日 23:24:44 collectd-client collectd [25489]:write_graphite 插件:发送到石墨服务器:2003((null))失败,状态为 -1(连接被拒绝) 1 月 29 日 23:24:44 collectd-client collectd [25489]:collectd:停止 5 个写入线程。

collectd.conf as below
LoadPlugin syslog
LoadPlugin cpu
LoadPlugin df
LoadPlugin disk
LoadPlugin interface
LoadPlugin load
LoadPlugin memory
LoadPlugin rrdtool
LoadPlugin write_graphite
<Plugin df>
        MountPoint "/"
</Plugin>
<Plugin disk>
        Disk "/^[hs]d[a-f][0-9]?$/"
</Plugin>
<Plugin interface>
        Interface "eth0"
</Plugin>
<Plugin write_graphite>
  <Node "carbon">
    Host "sde-graphite"
    Port "2003"
    Prefix "collectd"
    Postfix "collectd"
    StoreRates true
    AlwaysAppendDS false
    EscapeCharacter "_"
  </Node>
</Plugin>
4

2 回答 2

1

验证 carbon 是否在 2003 端口的主机 sde-graphite 中运行。你可以做一个 netstat 并查看 2003 是否有UDP 侦听器。我猜,它没有运行。

于 2015-01-31T20:37:05.973 回答
1

解决了:

我遇到了同样的问题,我的指标总是有效,但随机一些节点停止发送指标。并且 collectd 显示相同的错误:

Jun 18 15:04:23 node-a collectd [20235]: write_graphite plugin: send to 10.8.0.100:2003 (udp) failed with status -1 (Invalid argument)

6 月 18 日 15:04:23 node-a collectd [20235]:过滤子系统:内置目标“写入”:向所有写入插件分配值失败,状态为 -1。

守护进程仍然存在,但没有向石墨发送指标。注意:我的节点通过 openvpn 隧道将数据发送到石墨。

这似乎是针对石墨服务器的连接超时错误。我可以通过停止/中断 vpn 服务来重现该错误,并立即 collectd 显示上述错误。

希望它有助于享受!

于 2015-06-22T06:58:42.600 回答