嗨,我正在做一个关于数据仓库的项目,但我不确定我是否正确地为我的数据仓库建模。我的数据仓库不在业务流程中,因此我找到的信息很少。
基本上我有很多库文件,每个库文件包含许多单元信息,每个单元包含许多引脚信息,每个引脚包含时序和功率信息。不同的库文件基本上包含相同数量的单元和引脚结构,只是时序/功率信息不同
库 -> 单元 -> 引脚 -> 时序/电源
我很想知道电池属性-时间/功率,以便稍后进行比较。
我是否应该在雪花模式中按仓库建模,其中我的事实表仅包含库维度和日期维度的外键。然后库维度又分为cell维度,cell维度又分为pin维度,pin维度又分为时序维度和功率维度
或者在我的事实表包含库、单元格、引脚、时间、功率和日期维度的外键的星型模式中?
我担心的是我的数据非常大,因为我有大约 200 个库文件,每个库文件包含大约 20k 单元,每个单元包含几个引脚,每个引脚包含一些时序和功率信息。因此总尺寸很大,即 200 x 20,000 x 4 x 4
每当有新版本的库文件发布时,我都会不断地输入这个庞大的数据集
可以给我建议哪个更好吗?dfdf
编辑:
Library A
Cell A
Pin A1
Condition A11
riseTimingTemplate
fallTimingTemplate
risePowerTemplate
fallPowerTemplate
层次结构如上所示。不同的库将包含相同的单元、引脚和条件,只有时序和电源模板不同。
假设我的事实粒度将是特定单元格的时间和功率值,
因此我的维度将具有库、单元格、引脚、条件、risingTimingTemplate、fallTimingTemplate、risePOwerTemplate 和 fallPowerTemplate,所有链接到事实表是否正确?