2

我刚刚发现我的生产服务器上的一个表(包含大约 35K 记录)在具有 AUTO_INCREMENT 的 INT(11) 列中包含 588 个重复条目。该列上缺少 UNIQUE 键,因此这可能是原因。

关于如何为所有重复条目提供唯一 ID,然后将 UNIQUE 键添加到列中的任何想法,这样就不会再发生这种情况?

表架构:

CREATE TABLE `items` (
 `item_ID` int(11) unsigned NOT NULL auto_increment,
 `u_ID` int(10) NOT NULL default '0',
 `user_ID` int(11) NOT NULL default '0',
 `p_ID` tinyint(4) NOT NULL default '0',
 `url` varchar(255) NOT NULL,
 `used` int(10) unsigned NOT NULL,
 `sort` tinyint(4) NOT NULL,
 `last_checked` int(11) NOT NULL,
 `unixtime` int(11) NOT NULL,
 `switched` int(11) NOT NULL,
 `active` tinyint(1) NOT NULL default '0',
 UNIQUE KEY `unique` (`p_ID`,`url`),
 KEY `index` (`u_ID`,`item_ID`,`sort`,`active`),
 KEY `index2` (`u_ID`,`switched`,`active`),
 KEY `item_ID` (`item_ID`),
 KEY `p_ID` (`p_ID`),
 KEY `u_ID` (`u_ID`)
) ENGINE=MyISAM AUTO_INCREMENT=42755 DEFAULT CHARSET=utf8
4

3 回答 3

2

这样的事情怎么样?首先在备份上再次测试它。

# Copy duplicate records
CREATE TABLE newitem SELECT * FROM items WHERE item_ID IN 
    (SELECT item_ID FROM itemd GROUP BY item_ID HAVING COUNT(*) > 1);

# remove auto increment from id in new table
ALTER TABLE newitem DROP INDEX Item_ID, MODIFY item_ID int;

# delete duplicates from original
DELETE FROM item WHERE item_ID IN (SELECT DISTINCT item_ID FROM newitem);

#Update column to be primary key
ALTER TABLE items DROP INDEX Item_ID, ADD PRIMARY KEY (Item_ID);

# Set new duplicate ID's to null
UPDATE newitem SET item_ID=NULL;

# Insert records back into old table
INSERT INTO item SELECT * FROM newitem;

# Get rid of work table
DROP newitem;
于 2011-12-12T22:48:35.223 回答
2

由于您已经UNIQUE在表上有一个键,您可以使用它来创建一个UPDATE语句,将唯一 ID 重新分配给item_id

UPDATE
        items AS it
    JOIN
        ( SELECT 
              i.p_ID, i.url, @id:= @id+1 AS id
          FROM 
                  items AS i  
              CROSS JOIN 
                  ( SELECT @id:=0 ) AS dummy
          ORDER BY
              i.p_ID, i.url
        ) AS unq
      ON 
      (unq.p_ID, unq.url) = (it.p_ID, it.url)
SET 
    it.item_id = unq.id ;

然后你可以添加一个唯一的索引item_id

于 2011-12-12T22:56:45.523 回答
1

有趣的。你有一个没有主键引用的 auto_increment,只是一个索引,这就是为什么你首先有欺骗。如果您尝试更新和分配primary key (item_ID)MySQL 将因为 item_ID 列中的欺骗而抱怨。

您的引擎是 MyISAM,这意味着您没有任何 FK 约束,因此您可以对表执行 mysqldump、截断表、更新架构,然后重新导入数据。重新导入后,MySQL 应正确插入具有真正唯一 Item_Ids 的所有行。

我将在此处概述这些步骤,但我强烈建议您在开发环境中执行此操作,以确认这些步骤正常工作,然后再应用于您的生产环境。我对错误的生产数据不承担任何责任:)

$ mysqldump -u <user_name> -h <db_host> --opt <database_name> --single-transaction > backup.sql

mysql> truncate table `items`;

mysql> ALTER TABLE `items` DROP INDEX `Item_ID`, ADD PRIMARY KEY (`item_ID`), AUTO_INCREMENT = 1;

$ vi backup.sql # Remove the AUTO_INCREMENT reference from the Create Table syntax

$ mysql -h <host_name> <db_name> -u <username> -p < backup.sql    

试一试,这些步骤未经测试,但应该让你走上正确的道路。

于 2011-12-12T22:29:58.247 回答