我有两个结构相同的表 t1 和 t2。
表 t1 比 t2 多出大约 100 多条记录。
这是 t1 的一个小样本。
| pid | tid | amt | paymentdt | paymentmnth | startdate | enddate | updtby
| 670 | 1 | 690.00 | 2015-07-07 | 2015-07-07 | 2015-10-26 14:36:27.000 | 2015-10-26 15:42:42.000 | NULL
| 670 | 11 | 855.00 | 2015-07-07 | 2015-07-07 | 2015-10-26 14:36:27.000 | NULL | NULL
| 670 | 13 | 129.00 | 2015-07-29 | 2015-07-29 | 2015-10-26 14:36:27.000 | NULL | NULL
| 670 | 2 | 855.00 | 2015-09-01 | 2015-09-01 | 2015-10-26 15:42:42.000 | NULL | NULL
| Z41 | 1 | 62.35 | 2015-05-08 | 2015-05-08 | 2015-10-26 10:15:24.000 | 2015-10-26 13:08:05.000 | NULL
| Z41 | 11 | 800.00 | 2015-05-08 | 2015-05-08 | 2015-10-26 10:15:24.000 | NULL | NULL
| Z41 | 2 | 298.00 | 2015-06-01 | 2015-06-01 | 2015-10-26 13:08:05.000 | 2015-10-26 14:36:27.000 | NULL
| Z41 | 3 | 298.00 | 2015-07-01 | 2015-07-01 | 2015-10-26 14:36:27.000 | 2015-10-26 15:15:45.000 | NULL
| Z41 | 4 | 298.00 | 2015-08-01 | 2015-08-01 | 2015-10-26 15:15:45.000 | 2015-10-26 15:42:42.000 | NULL
| Z41 | 5 | 238.00 | 2015-09-01 | 2015-09-01 | 2015-10-26 15:42:42.000 | NULL | NULL
和一个小样本 t2。
| pid | tid | amt | paymentdt | paymentmnt | startdate | enddate | updtby
| 670 | 1 | 690.00 | 2015-07-07 | 2015-07-07 | 2015-10-02 16:10:50.000 | 2015-10-02 16:35:50.000 | NULL
| 670 | 11 | 855.00 | 2015-07-07 | 2015-07-07 | 2015-10-02 16:10:50.000 | NULL | NULL
| 670 | 13 | 129.00 | 2015-07-29 | 2015-07-29 | 2015-10-02 16:10:50.000 | NULL | NULL
| 670 | 2 | 855.00 | 2015-09-01 | 2015-09-01 | 2015-10-02 16:35:50.000 | NULL | NULL
| Z41 | 1 | 298.00 | 2015-07-01 | 2015-07-01 | 2015-10-02 16:10:50.000 | 2015-10-02 16:23:26.000 | NULL
| Z41 | 11 | 800.00 | 2015-05-08 | 2015-05-08 | 2015-10-02 16:10:50.000 | NULL | NULL
| Z41 | 2 | 298.00 | 2015-08-01 | 2015-08-01 | 2015-10-02 16:23:26.000 | 2015-10-02 16:35:50.000 | NULL
| Z41 | 3 | 238.00 | 2015-09-01 | 2015-09-01 | 2015-10-02 16:35:50.000 | NULL | NULL
| 173 | 1 | 785.00 | 2015-07-01 | 2015-07-01 | 2015-10-02 16:16:30.000 | 2015-10-02 16:27:36.000 | NULL
| 173 | 11 | 465.00 | 2015-05-01 | 2015-05-01 | 2015-10-02 16:16:30.000 | NULL | NULL
现在比较 t1 和 t2 显示 t1 中的 pid 值更多,Z41
例如 tid 包括 1、2、3、4、5 和 11。但在 t2 中仅存在 1、2、3 和 11。
然而,t1 和 t2 之间的 startdate 完全不同,所以这会引起麻烦。下面是我尝试过的合并,但它基本上只是在 t2 中插入与 t1 不同的 startdate 的每一行。
MERGE INTO t2 AS tgt
USING t1 AS src
ON tgt.pid = src.pid AND
tgt.tid = src.tid AND
tgt.paymentdt = src.paymentdt AND
tgt.paymentmnt = src.paymentmnt AND
tgt.startdate = src.startdate
WHEN MATCHED THEN
UPDATE SET
tgt.amt = src.amt,
tgt.paymentdt = src.paymentdt,
tgt.updatedby = 'MERGEDUPDATE'
WHEN NOT MATCHED THEN
INSERT (pid, tid, amt, paymentdt, paymentmnt, startdate, enddate, updtby)
VALUES (src.pid, src.tid, src.amt, src.paymentdt, src.paymentmnt, src.startdate, src.enddate, 'MERGEDINSERT');
通过此合并,我留下pid and tid
了updtby
列中显示“MERGEDINSERT”的重复项。但我想避免重复。
如何正确进行此合并以不产生重复项,但插入 t1 中存在但不存在于 t2 中的行,同时
amt, paymentdt, and paymentmnth
在保持 startdate 的同时更新值?