虽然这个问题在过去已经提出,但我很好奇这是否仍然是清理大型(3M 和不断增长的)表中重复条目的最佳方法。每次批量插入后,我都会运行这一行以保持整洁,但它开始需要很长时间才能执行。
重复行只能通过 3 列确定。其他的要么自动递增,有唯一ID、来源等。
这是我目前要做的-
DELETE n1
FROM main n1, main n2
WHERE n1.id < n2.id
AND n1.col1 = n2.col1
AND n1.col2 = n2.col2
AND n1.col3 = n2.col3
有没有机会我可以加快速度,或者这是否尽可能好?
感谢您的任何帮助/见解!