0

每天我们以 excel 格式获取数据,我们将数据加载到 staging 中,然后转到 SSIS 包并将 excel 作为连接管理器并执行转换并将数据移动到仓库。既然我们只是从 excel 中获取数据,那么为什么要创建一个阶段并截断它,因为我们将 excel 作为源并且每个操作都在其中完成?有人可以解释一下实时场景吗?我看过很多网站,无法理解这个概念是什么,比如登台、源(excel)、查找目标(仓库) 为什么要创建到登台,因为一切都在做 SSIS 包?

4

1 回答 1

0

暂存区主要用于快速从其数据源中提取数据,最大限度地减少数据源的影响。数据加载到暂存区后,暂存区用于组合来自多个数据源的数据、转换、验证、数据清理。

您可以使用登台设计模式

  • 增量负载
  • 截断插入
  • 使用带有 HashBytes 的分隔符进行更改检测

您可以了解用于加载数据仓库的包设计模式

于 2021-02-06T21:54:33.550 回答