5

我们的物联网设备大部分都很好地连接到互联网,但网络有可能出现故障。对于这种情况,设备本身会做正确的事情(虽然它不能再被主动控制)。我们仍然希望获取网络停机时间的指标数据。

这意味着设备本地电报需要收集指标数据,存储它并检查网络连接。如果网络(再次)启动,则例如转发到 influxDB。

是否可以使用 Telegraf/InfluxDB 或 prometheus 来实现这种情况?

4

1 回答 1

4

Telegraf 无法在发生故障时将指标存储在本地驱动器上。但是,可以缓冲未成功发送的指标(我相信 RAM)并在成功写入时刷新缓冲区。查看metric_buffer_limitTelegraf 配置中的选项:

# Configuration for telegraf agent
[agent]
  ## For failed writes, telegraf will cache metric_buffer_limit metrics for each
  ## output, and will flush this buffer on a successful write. Oldest metrics
  ## are dropped first when this buffer fills.
  ## This buffer only fills when writes fail to output plugin(s).
  metric_buffer_limit = 10000

这样,只要您不溢出此缓冲区,在 InfluxDB 关闭时收集的指标仍将保留并稍后重新发送。

编辑:您可以在此处跟踪类似的功能请求。

于 2018-06-19T07:19:34.263 回答