我正在构建数据仓库(DW),我有一个关于加载数据的问题;如果你们提供您对此的想法,我将不胜感激。
我打算先将所有表一对一地加载到临时数据库中,然后将数据从临时数据库加载到 DW 中。我曾考虑过直接使用 OLTP 系统(无分段),但我不是 100% 确定从性能角度来看这将是最好的方法。
让我举个例子:在我们的 OLTP 数据库中,我们有一个名为“客户”的视图,我将把它拉入我们的 DW。OLTP 数据库的视图相当复杂,一个 select 语句需要 8 分钟。因此,如果我将此表直接加载到 DW 并进行增量加载,我认为这将比首先将视图加载到临时表中花费更多时间。此外,由于加载需要时间,DW 的可用性也会受到影响,因为数据将无法供用户查询。
你们有什么建议?分期方法现在过时了吗?我想了解优点和缺点。在此先感谢您的帮助