2

我在数据库中有 20,000 个数据点,我想将其显示在 google 注释图上。我认为大约 2000 点对于实际使用图表来说是一个很好的数字,所以我想使用平均值而不是我拥有的实际数据点数量。

该数据计算某事在某个时间出现的频率。它就像表(频率,日期时间)

因此,在第一周,我将 datetime 间隔为每 10 分钟一次,并且频率将是该时间间隔(10 分钟)的所有频率的平均值。同样,在那之后的一个月里,我将有一个小时的日期时间间隔等。

我认为这也是你可以在谷歌金融上看到的东西,一段时间后,即使你放大数据点的分辨率也会降低。

那么什么是一个好的设计呢?是否已经存在可以执行此类操作的工具?我已经想到(尽管它可能不太好)一个包含所有 20,000 个点的巨型表和几个代表每个时间间隔(1 周、1 个月等)的较小表,这些表是通过对较大表的查询构建的,并不断更新和修剪具有新的平均值。

4

1 回答 1

1

将数据库中的原始数据保存在一张表中。有第二个 reprti g 表,您可以使用脚本或查询从原始表中填充该表。填充报告表的转换可以根据需要对存储桶进行分组和平均。重要的是不要在初始插入时转换数据——保留所有原始数据。这样,如果你搞砸了,你总是可以回滚或重建。

ETL。学习它。爱它。活下去。

于 2012-07-16T23:59:45.827 回答