我在全国部署了一个数据采集系统网络。每个系统都在测量不同建筑物的性能。每个系统都进行温度、流量、速度、能量和其他类型的测量。采样率因系统而异;它可以低至 5 秒,高至 15 分钟。
我的目标是将所有数据存储在 SSAS 数据库中以进行分析。但是,我正在努力确定适当的粒度和相关的事实表以及 SSAS 度量/度量组设计。
我的第一个问题是,以下是否有相同的纹理?:
- 具有不同单位的数据值,例如温度和能量值
- 不同采样率的数据值,例如每分钟采样一次的温度值和每15分钟采样一次的温度值
- 从不同建筑物记录的数据值,例如1号楼的室内温度和2号楼记录的室内温度
- 加法数据值(例如能量)和非加法数据值(例如温度)
- 在特定建筑物中使用相同单位进行两次不同的测量,例如一楼温度和二楼温度。
如果这些示例中的大多数或全部没有相同的粒度,这是否意味着每个建筑物的度量都应该在关系数据仓库中有一个单独的事实表,而在 SSAS 数据库中应该有一个单独的度量?如果是,那么如果我们假设我正在研究 10 个建筑物,每个建筑物都有 100 个测量值,那么我会查看 1000 个测量值。这似乎不对,但似乎我正在处理一个具有许多不同度量粒度的数据模型。
我发现的几乎所有示例都与金融或零售有关,它们由明显可加或可数的度量组成,例如美元金额或项目。因此,这些示例并没有太大帮助。