1

我是数据仓库的初学者。我们创建了一个数据集市,一个星型模式设计来加载季度数据。当该季度的业务批准时,我们一直在加载当前数据。

现在我们需要返回并加载历史数据(3 年,大约 40GB)。加载此数据的维度将与用于季度加载的维度相同。但是,我们可以将这些历史数据加载到同一个事实表中,还是必须创建一个重复的事实表来单独加载历史数据?那是DW标准吗?我正在尝试按照标准找到执行此操作的方法。

当前事实表在 load_cycle_date 上进行日期分区,它指定了加载数据的季度。

非常感谢!

4

1 回答 1

0

我不明白为什么获取历史数据和使用旧的 load_cycle_dates 不适合您现有的表。这假设您能够将它们转换成这种格式。这是基于这些年来数据结构发生了多少变化。

您还需要研究其他领域:

  1. 你的所有维度都有足够的历史价值吗?示例:客户评级。可能有些客户最终被评为“差”,但以前并非如此。每次更改都需要记录。另一种方法是从备份中提取数据。
  2. 审批流程 - 通常很多数据差异在开始之前不会被发现。因此,进行这些更正的应用程序可能已发生更改。您可能会发现某些报告运行截至此“先前数据仓库”的数据,将不准确。

您没有理由不能在四分之一时间内执行此操作并对其进行测试。这是您确定的唯一方法。我使用的当前数据仓库在启动数据仓库之前经历了相同的添加数据过程。转换很常见。

于 2014-02-28T20:31:27.977 回答