我有 10 个表,每个表都有 0.5+M 条记录(总共 9M 条记录)。每个表的结构都非常相似。现在我想删除每个表内和表之间的重复项,或者说我想查看所有表中存在谁以及我实际拥有多少唯一记录。但问题是数据量巨大。
所以我计划创建不同的表 - 1 用于电子邮件地址,1 用于手机号码,1 用于地址等等。但是现在如果每个表都有 5M 记录,那么我的表会变得非常慢。
一种解决方案是我按照出生日期的月份创建表,这将导致 12 个表,然后我将能够对每个表中的数据进行排序。
请建议我该怎么办?数据为 960 万条记录 / 3.2GB
还建议如何将数据从 1 个表快速移动到其他表。