11

多年来,我一直在处理这个问题,但一直无法深入了解它。我不知道是什么导致了这些锁。

错误是:Lock wait timeout exceeded; try restarting transaction SQLState: 41000 VendorError: 1205

SQL 语句是在事务中运行的单个插入语句。所有插入都是这种形式,因此没有批量插入或混合模式插入等。

INSERT INTO attachment( id, entityid, entitytype , addeduserid , deleteduserid , fullpath , filename, status, creationdate, lastupdated, deletiondate, hasfile,notes,history,type,mimeinfo,archivedby,archivedon, referencedate,changedby,changedon ) values (0,0,2,360,null,NULL,NULL,1,'2013-02-20 08:45:31','2013-02-20 08:45:31',NULL,0,NULL,'20/02/2013 08:45:UserA:File uploaded internally. <br>',0,NULL,null,NULL,NULL,null,NULL);

系统配置:Mysql 版本:'Server version: 5.1.61 Source distribution'(在 Redhat 上)

存储:INNODB

INNODB 相关配置(部分来自 my.cnf 编辑):

innodb_file_per_table=1
innodb_buffer_pool_size=3G
innodb_additional_mem_pool_size=20M
innodb_log_file_size=512M
innodb_log_files_in_group=2
innodb_log_buffer_size=16M
innodb_support_xa=1
innodb_doublewrite=1
innodb_thread_concurrency=0
innodb_flush_log_at_trx_commit=2
innodb_autoinc_lock_mode=2**
innodb_rollback_on_timeout=1
innodb_locks_unsafe_for_binlog=1**
thread_cache_size=8
query_cache_size=256M
query_cache_limit=4M
table_cache=2048
table_definition_cache=1024
tmp_table_size=512M
max_heap_table_size=512M
transaction-isolation=READ-COMMITTED**
innodb_table_locks=0**
innodb_lock_wait_timeout=50**

** 这些是针对此问题专门添加的。

一般来说:

系统(即有 6 个应用程序实例,每个实例具有相同的数据库结构,都在一个 mysql 实例上运行)可以运行好几天,然后可以在开始发生锁定等待的情况下运行,并且通常会让它们在此期间以组的形式出现的一天。每个单独的错误都会重复发生,因为一旦失败,我会再试一次,通常重试会失败。我已配置为重试 4 次。通常,锁只会出现在几个不同的表上。

今天这个问题的具体实例:

今天早上在attachment桌子上,从昨晚开始,桌子上就没有插入过。自前一天晚上以来,桌面上也没有任何更新。如果锁与其他用户进行更新和插入无关,那么某些选择语句会导致锁吗?我试图确保所有选择语句都使用attachment_general_index

由于我主要在几个不同的表上得到这个 - 这是这个表的结构。

CREATE TABLE `attachment` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`entityid` int(10) unsigned DEFAULT NULL,
`entitytype` tinyint(3) unsigned NOT NULL DEFAULT '0',
`addeduserid` int(10) unsigned NOT NULL,
`deleteduserid` int(10) unsigned DEFAULT NULL,
`fullpath` varchar(255) DEFAULT NULL,
`filename` varchar(255) DEFAULT NULL,
`status` tinyint(3) unsigned NOT NULL DEFAULT '0',
`creationdate` varchar(40) DEFAULT NULL,
`lastupdated` varchar(40) DEFAULT NULL,
`deletiondate` varchar(40) DEFAULT NULL,
`hasfile` tinyint(3) unsigned NOT NULL DEFAULT '0',
`notes` text,
`history` text,
`type` tinyint(3) unsigned DEFAULT '0',
`lastupdatedby` int(10) DEFAULT '0',
`lastupdatedinfo` varchar(255) DEFAULT NULL,
`mimeinfo` varchar(255) DEFAULT NULL,
`archivedby` int(10) unsigned DEFAULT NULL,
`archivedon` varchar(40) DEFAULT NULL,
`referencedate` varchar(40) DEFAULT NULL,
`changedby` int(10) unsigned DEFAULT NULL,
`changedon` varchar(40) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `attachment_addeduserid_fkey` (`addeduserid`),
KEY `attachment_deleteduserid_fkey` (`deleteduserid`),
KEY `attachment_archivedby_fkey` (`archivedby`),
KEY `attachment_changedby_fkey` (`changedby`),
KEY `attachment_general_index` (`entitytype`,`entityid`,`status`,`type`),
CONSTRAINT `attachment_ibfk_1` FOREIGN KEY (`addeduserid`) REFERENCES `user` (`id`),
CONSTRAINT `attachment_ibfk_2` FOREIGN KEY (`deleteduserid`) REFERENCES `user` (`id`),
CONSTRAINT `attachment_ibfk_3` FOREIGN KEY (`archivedby`) REFERENCES `user` (`id`),
CONSTRAINT `attachment_ibfk_4` FOREIGN KEY (`changedby`) REFERENCES `user` (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=3619 DEFAULT CHARSET=latin1$$

我附上了最近的 SHOW INNODB STATUS,这是从今天开始的,从昨天开始就没有锁等待。我不明白所有这些输出,但主要是锁似乎从未出现在这里。我认为是因为它们没有被归类为死锁?

https://docs.google.com/document/d/1Hslf2B594n8ofAUYxN54Gh8FrSCIFNGGMtthVI_Lv4k/pub

是否只有死锁区域对此问题感兴趣?如果有其他方面我会尽量收集,当它发生并可以提供。

任何帮助,将不胜感激。

缺口

4

2 回答 2

9

我想与那些因事务超时而摸不着头脑并发现建议的服务器配置更改都无济于事的人分享我的“尤里卡”时刻。

我陷入了困境,以至于我正在认真考虑重写我的一些应用程序,以便我可以适应事务超时(全世界都能听到集体的呻吟声)。

我对从我的业务交易中丢失任何东西感到偏执,所以我运行一个 cron 作业,全天每 10 分钟执行一次完整的 mysqldump(这是在双重复制之上)。

我发现 mysqldump 占用了服务器,锁定了表,并且几乎禁止其他任何东西在它做这件事时使用数据库。当我发现事务失败与 mysqldump 运行时间同时发生时,我的尤里卡时刻到来了。

长话短说,有 3 个命令行选项可以防止 mysqldump 杀死你的服务器。这些是

  1. --单笔交易
  2. - 快的
  3. --lock-tables=false

非常感谢 CA3LE @如何减慢 MySQL 转储速度而不影响服务器上的当前负载?为了启发我。

于 2014-03-22T22:17:46.743 回答
3

(这可能应该是一个评论,但我有太多的文字,需要格式化)。

我认为这是一个与以下描述的问题非常相似的问题:

  1. 一个事务在表的末尾有一个锁。
  2. 第二个事务锁定了表的大部分。
  3. 第一个事务尝试更新/插入第二个事务持有的锁。这失败了,因此交易之一被选择终止。

感谢您发布show status. 您是对的,显示的死锁似乎与您所询问的表无关,但它似乎与 Xaprb 中的死锁相同。

是否只有死锁区域对此问题感兴趣?

是的,确切的部分是:

Transaction 1

UPDATE operative SET  lastupdated='2013-02-19 17:12:44'=N<EDITED> RECORD LOCKS space id 1789 page no 3622 n bits 112  index `PRIMARY` of table `<EDITED> `.`operative` trx id 0 233901602  lock_mode X locks rec but not gap waiting

*** (1) WAITING FOR THIS LOCK TO BE GRANTED: RECORD LOCKS space id 1789 page no 3622 n bits 112 index `PRIMARY` of table `<EDITED> `.`operative`  trx id 0 233901602 lock_mode X locks rec but not gap waiting


Transaction 2

INSERT INTO opdate(operativeId,opdate,updatingUser,dategroup,type,notes,lastupdated) values (....) RECORD LOCKS space id 1789 page no 3622 n bits 112 index `PRIMARY` of table `<EDITED> `.`operative`  trx id 0 233901603 lock mode S locks rec but not gap


*** (2) WAITING FOR THIS LOCK TO BE GRANTED: RECORD LOCKS space id 830 page no 112 n bits 808  index `opdate_unique` of table `<EDITED> `.`opdate` trx id 0 233901603 lock mode S waiting Record lock, heap no 739 PHYSICAL RECORD: n_fields 3; compact format; info bits 0

这感觉与 xaprb 中列出的问题非常相似。IE

  1. 事务 2 已对表进行了插入操作,现在在主键上持有锁。
  2. 事务 1 正在执行表扫描以进行更新,并且正在等待对该主键的锁定。
  3. 事务 2 正在尝试进行另一个插入,并且需要获得一个锁,但由于事务 1 已经拥有它而被阻止这样做(我实际上是在猜测那里,因为你混淆了表名)。

我建议先解决这个僵局,然后尝试解决您所询问的问题。

实际上,我认为您的问题可能不会出现在 INNODB 状态中。您收到错误代码 1205 - 这是 ER_LOCK_WAIT_TIMEOUT,而不是错误 1213 ER_LOCK_DEADLOCK。因此,尽管您实际上陷入了僵局,但它并没有被归类为这样。

我认为如果你能SHOW ENGINE INNODB STATUS在问题发生时做一段时间,你应该能够看到那里的停滞事务的锁,即使它们没有显示为最新的死锁。

于 2013-02-21T00:46:41.153 回答