我正在尝试对可能跨分区重复的表进行去重复。例如
id device_id os country unix_time app_id dt
2 2 3a UK 7 5 2019-12-22
1 2 3a USA 4 5 2019-12-22
1 2 3a USA 4 5 2019-12-23
1 2 3a USA 4 5 2019-12-24
可以看出,除了作为分区列的“dt”之外,该表具有相似的列值。我想删除这样一个表,其中旧分区中的类似记录将被删除,而记录在最新分区中。例如,上表在重复数据删除后应如下表所示。
id device_id os country unix_time app_id dt
2 2 3a UK 7 5 2019-12-22
1 2 3a USA 4 5 2019-12-24