我是数据仓库的初学者。我们创建了一个数据集市,一个星型模式设计来加载季度数据。当该季度的业务批准时,我们一直在加载当前数据。
现在我们需要返回并加载历史数据(3 年,大约 40GB)。加载此数据的维度将与用于季度加载的维度相同。但是,我们可以将这些历史数据加载到同一个事实表中,还是必须创建一个重复的事实表来单独加载历史数据?那是DW标准吗?我正在尝试按照标准找到执行此操作的方法。
当前事实表在 load_cycle_date 上进行日期分区,它指定了加载数据的季度。
非常感谢!
我是数据仓库的初学者。我们创建了一个数据集市,一个星型模式设计来加载季度数据。当该季度的业务批准时,我们一直在加载当前数据。
现在我们需要返回并加载历史数据(3 年,大约 40GB)。加载此数据的维度将与用于季度加载的维度相同。但是,我们可以将这些历史数据加载到同一个事实表中,还是必须创建一个重复的事实表来单独加载历史数据?那是DW标准吗?我正在尝试按照标准找到执行此操作的方法。
当前事实表在 load_cycle_date 上进行日期分区,它指定了加载数据的季度。
非常感谢!
我不明白为什么获取历史数据和使用旧的 load_cycle_dates 不适合您现有的表。这假设您能够将它们转换成这种格式。这是基于这些年来数据结构发生了多少变化。
您还需要研究其他领域:
您没有理由不能在四分之一时间内执行此操作并对其进行测试。这是您确定的唯一方法。我使用的当前数据仓库在启动数据仓库之前经历了相同的添加数据过程。转换很常见。