我使用 influx db 来保存我网站的性能数据。我的 influx db 中的数据如下:
//mock data
time load
---- ----
2018-11-27T08:34:46.899z 262
2018-11-27T08:35:46.899z 300
2018-11-27T08:36:46.899z 102
2018-11-27T08:37:46.899z 1000
2018-11-27T08:38:46.899z 800
2018-11-27T08:39:46.899z 6000
2018-11-27T08:40:46.899z 326
2018-11-27T08:41:46.899z 500
2018-11-27T08:42:46.899z 90
2018-11-27T08:43:46.899z 902
我的目的是得到负载值的分布。例如,我想以如下形式获取加载时间的分布:
load frequent
---- ----
0~100 1
100~200 1
200~300 2
300~400 2
.
.
.
5000~6000 1
我尝试通过两种方式解决此问题,但我认为这不是获得此结果的最佳方式。
(一)查询整个加载时间,然后在我的nodejs服务器中计算这个结果。我认为当我想获得一年或更长时间的分布时,这个解决方案会遇到性能问题。
(二) 在将我的原始数据保存到 influx db 的同时,我计算了加载时间的范围,然后将其保存到另一个 influx db 表中,计算表如下:
// load distribute table
time 100~200 200~300 300~400 .... 5000~6000
---- ---- ---- ---- ----
08:34:46 1
08:34:47 1
08:34:48 1
08:34:49 1
08:34:50 1
// then in the future I can get the distribution like this:
select count(*) from load_distribute