我正在处理的数据仓库在事实表中有快照数据(按周),并且大约有 5 个 SCD 类型 2 维表。
一旦使用与暗表连接的查询将快照插入事实表中,就不会再次触及事实表中的数据。如果我重新运行加载,进程会删除该周的所有现有数据并重新插入。
代理键存在于所有事实和维度上,但不会通过使用主键或外键约束在物理上强制执行。
我没有强制执行约束,认为每次进行故障排除时停用会很痛苦,这是我之前遇到的情况,我不喜欢进入。
我的方法真的是不好的做法吗?
我正在处理的数据仓库在事实表中有快照数据(按周),并且大约有 5 个 SCD 类型 2 维表。
一旦使用与暗表连接的查询将快照插入事实表中,就不会再次触及事实表中的数据。如果我重新运行加载,进程会删除该周的所有现有数据并重新插入。
代理键存在于所有事实和维度上,但不会通过使用主键或外键约束在物理上强制执行。
我没有强制执行约束,认为每次进行故障排除时停用会很痛苦,这是我之前遇到的情况,我不喜欢进入。
我的方法真的是不好的做法吗?