0

我们的源系统数据不是在交易记录中引用产品和客户业务键的典型销售交易表。在我获得客户或产品信息之前,中间有一两个表。当我将数据加载到 DW 中的临时表中时,我计划准备数据(通过使用 spark 对存储在数据湖中的事务和客户/产品之间的所有表执行连接)以获得客户和产品业务密钥。这是正确的方法吗?我不想在临时表上执行这些连接。相反,我想使用所有上下文(关联的业务键)加载准备好的数据。在将它们加载到目标事实表时,我将用代理键替换这些键。

4

0 回答 0