作为迁移项目的一部分,我希望协调两个事实表(高基数,每行大约 500k 行 - 有很多客户帐户,必须根据客户帐户进行协调)。两个表中的客户列之间存在多对多关系。
我正在努力寻找一种有效的方法来输出出现在两个表中但价值不同的客户。
我已经尝试在 Power Query 中合并,但它非常慢 - 可能是由于体积和高基数因素。
我欢迎任何有关如何有效产生所需输出的建议?
输入表1:
Customer | Type | Channel | Loan
Jones | A | Branch | 100
Taylor | B | Phone | 200
Taylor | B | Online | 60
Jerez | C | Online | 120
Murray | D | Phone | 90
输入表2:
Customer | Type | Loan
Jones | A | 81
Taylor | B | 285
Jerez | C | 80
Jerez | C | 40
Seinfeld | A | 140
期望的输出:
客户在两个表中,但区别在于贷款:
Customer | Type1 | Loan1 | Loan2
Jones | A | 100 | 81
Taylor | B | 260 | 285
- 其中贷款 1 为表 1 中的贷款;贷款 2 为表 2 中所列的贷款。
感谢您花时间看这个问题。