我在 BigQuery 中有这个表,我想检查三列的重复项:
- 客户 ID、日期 1 和产品。
如果存在重复项,我需要将其删除并在比较两者后保留较新的日期(日期 1 或日期 2)。
对于以下示例,结果应为:
| 客户ID | 日期1 | 日期2 | 产品 | 价格 |
|---|---|---|---|---|
| 5421 | 2019-02-25 | 2019-02-25 | P1 | 500 |
| 6521 | 2010-07-06 | 2019-05-04 | P2 | 1254 |
| 4124 | 2019-05-03 | 2020-06-16 | P3 | 354 |
| 5421 | 2019-02-25 | 2019-12-15 | P1 | 547 |
结果:
| 客户ID | 日期1 | 产品 | 价格 |
|---|---|---|---|
| 6521 | 2010-07-06 | P2 | 1254 |
| 4124 | 2019-05-03 | P3 | 354 |
| 5421 | 2019-12-15 | P1 | 547 |
非常感谢!!!
