我是使用 SSIS 包的新手,并且对在将数据从登陆到登台时找到增量的最佳实践感到困惑。要求是从 Consolidated Data Store (CDS) 创建几个报告,数据从源头流到 Landing 到 Staging 到 CDS 作为 ETL 包,最后从 CDS 构建报告。
我已经成功创建了将数据从源移动到着陆的包,因为它们非常简单。将数据从 Landing 移动到 Staging 有点令人困惑,因为修改日期是不够的,因为从上次 ETL 运行进行 2 次更改可以将数据返回到前一个日期的数据,这意味着自上次 ETL 运行以来没有任何更改。例如,一个值从 A 变为 B,然后又变为 A - 表示数据已返回到原始状态,但 modifiedOn 列发生了变化。
那么,应该将 Landing 中的所有列与 Staging 中的现有列连续进行比较,还是仅将与交付报告相关的列进行比较?还是有其他方法可以找到增量?
如果不清楚或需要更多详细信息,请告诉我。