mysql - 如何删除没有临时表的 MySQL 表中的所有重复记录

Question

我已经看到了这方面的许多变化，但没有什么与我想要完成的完全匹配。

我有一个表格，TableA其中包含用户对可配置问卷的回答。列是member_id, quiz_num, question_num, answer_num。

不知何故，一些成员的答案被提交了两次。所以我需要删除重复的记录，但要确保留下一行。

没有主列，因此可能有两三行都包含完全相同的数据。

是否有删除所有重复项的查询？

score 102 · Accepted Answer

在您的表上添加唯一索引：

ALTER IGNORE TABLE `TableA`   
ADD UNIQUE INDEX (`member_id`, `quiz_num`, `question_num`, `answer_num`);

另一种方法是：

在表中添加主键，然后您可以使用以下查询轻松地从表中删除重复项：

DELETE FROM member  
WHERE id IN (SELECT * 
             FROM (SELECT id FROM member 
                   GROUP BY member_id, quiz_num, question_num, answer_num HAVING (COUNT(*) > 1)
                  ) AS A
            );

score 15 · Accepted Answer

代替drop table TableA，您可以删除所有寄存器 ( delete from TableA;)，然后使用来自 TableA_Verify ( insert into TAbleA select * from TAbleA_Verify) 的寄存器填充原始表。这样您就不会丢失对原始表的所有引用（索引，...）

CREATE TABLE TableA_Verify AS SELECT DISTINCT * FROM TableA;

DELETE FROM TableA;

INSERT INTO TableA SELECT * FROM TAbleA_Verify;

DROP TABLE TableA_Verify;

score 13 · Accepted Answer

这不使用 TEMP 表，而是使用真实表。如果问题只是临时表而不是表创建或删除表，这将起作用：

SELECT DISTINCT * INTO TableA_Verify FROM TableA;

DROP TABLE TableA;

RENAME TABLE TableA_Verify TO TableA;

score 8 · Accepted Answer

感谢 jveirasv 提供上述答案。

如果您需要删除特定列集的重复项，您可以使用它（例如，如果表中有不同的时间戳）

CREATE TABLE TableA_Verify AS SELECT * FROM TableA WHERE 1 GROUP BY [COLUMN TO remove duplicates BY];

DELETE FROM TableA;

INSERT INTO TableA SELECT * FROM TAbleA_Verify;

DROP TABLE TableA_Verify;

score 7 · Accepted Answer

在您的表上添加唯一索引：

ALTER IGNORE TABLE TableA   
ADD UNIQUE INDEX (member_id, quiz_num, question_num, answer_num);

工作得很好

score 3 · Accepted Answer

如果您不使用任何主键，则一次执行以下查询。通过替换值：

# table_name - Your Table Name
# column_name_of_duplicates - Name of column where duplicate entries are found

create table table_name_temp like table_name;
insert into table_name_temp select distinct(column_name_of_duplicates),value,type from table_name group by column_name_of_duplicates;
delete from table_name;
insert into table_name select * from table_name_temp;
drop table table_name_temp

创建临时表并存储不同（非重复）值
制作空的原始表
将值从临时表插入原始表
删除临时表

始终建议在使用数据库之前对其进行备份。

score 1 · Accepted Answer

另一种方法是创建一个具有相同结构的新临时表。

CREATE TABLE temp_table AS SELECT * FROM original_table LIMIT 0

然后在表中创建主键。

ALTER TABLE temp_table ADD PRIMARY KEY (primary-key-field)

最后从原始表中复制所有记录，同时忽略重复记录。

INSERT IGNORE INTO temp_table AS SELECT * FROM original_table

现在您可以删除原始表并重命名新表。

DROP TABLE original_table
RENAME TABLE temp_table TO original_table

score 1 · Accepted Answer

如评论中所述，如果项目多次重复，则必须多次运行 Saharsh Shah 答案中的查询。

这是一个不删除任何数据的解决方案，并且始终将数据保留在原始表中，允许在保持表“活动”的同时删除重复项：

alter table tableA add column duplicate tinyint(1) not null default '0';

update tableA set
duplicate=if(@member_id=member_id
             and @quiz_num=quiz_num
             and @question_num=question_num
             and @answer_num=answer_num,1,0),
member_id=(@member_id:=member_id),
quiz_num=(@quiz_num:=quiz_num),
question_num=(@question_num:=question_num),
answer_num=(@answer_num:=answer_num)
order by member_id, quiz_num, question_num, answer_num;

delete from tableA where duplicate=1;

alter table tableA drop column duplicate;

这基本上检查当前行是否与最后一行相同，如果是，则将其标记为重复（顺序语句确保重复显示将彼此相邻）。然后你删除重复的记录。我删除了duplicate最后的列以使其恢复到原始状态。

看起来alter table ignore也可能很快就会消失：http ://dev.mysql.com/worklog/task/?id=7395

score 1 · Accepted Answer

在mysql 5中测试。不知道其他版本。如果要保留 id 值最低的行：

DELETE n1 FROM 'yourTableName' n1, 'yourTableName' n2 WHERE n1.id > n2.id AND n1.member_id = n2.member_id and n1.answer_num =n2.answer_num

如果要保留具有最高 id 值的行：

DELETE n1 FROM 'yourTableName' n1, 'yourTableName' n2 WHERE n1.id < n2.id AND n1.member_id = n2.member_id and n1.answer_num =n2.answer_num

mysql - 如何删除没有临时表的 MySQL 表中的所有重复记录

9 回答 9

Related

Reference