5

我有一些带有图表的 grafana 仪表板,有时会显示“无数据点”。我知道有数据,因为其他时候我在同一页面上看到图表和其他图表显示来自相同测量的其他结果。另外,我可以直接在 influxdb 中查询数据。

有趣的是,似乎较长的时间段比较短的时间段更有可能导致这种故障(即,30 天有时会失败,1 天很少失败)。这是每隔几秒钟的数据,例如系统统计信息。

我怀疑(数据不足)influxdb 有时响应时间过长并且 grafana 超时,或者由于相对于可用资源的数据过多,influxdb 完全无法查询。OTOH,直接查询 influxdb 工作正常(见下文),尽管我一次只抛出一个查询。如果我在仪表板更新时进行查询,则查询需要更长的时间,就好像我在等待工作线程来处理我的查询一样。

但在我开始开发硬件之前,我想拥有的不仅仅是预感。我没有那么多数据。然而,influx 和 grafana 日志并没有向我展示任何非常有趣的东西(例如 OOM、超时或查询失败)。

有什么建议么?

顺便说一句,grafana 中的示例查询是这样的:

SELECT percentile("usage_system", 95) FROM "cpu"
WHERE "host" =~ /^$host$/ AND $timeFilter
GROUP BY time($__interval), "host"

如果我直接针对 influxdb 进行查询,查询结果几乎会立即返回,而在 grafana 中,我会等待很长时间并显示微调器。(如果我在更新仪表板的同时进行查询,则查询需要一点时间,这与等待工作线程处理我的查询一致。)

select percentile(usage_system, 95) from cpu
WHERE host = 'seine3'
AND time >= 1519216559000000000 AND time <= 1521808559000000000
GROUP BY time(1h), host

或者

select percentile(usage_system, 95) from cpu
WHERE host = 'seine3'
AND time >= '2018-02-23T00:00:00Z' AND time <= '2018-03-23T00:30:00Z'
GROUP BY time(1h), host
4

0 回答 0