mysql - 简化 MySQL 中的更新/插入（upsert）处理

Question

一个常见的操作是在不存在时插入新行，或者更新现有行。不幸的是，insert 和 update SQL 语句的语法完全不同：Insert 采用列列表，后跟相应的值列表，而 update 采用 column=value 对的列表。MySQL "insert...on duplicate key update" 语句（它的 upsert 语句）不能解决这个问题，因为它仍然需要完整的插入列/值列表，然后是完整的更新列/值列表。[更新：下面 Wrikken 的评论指出，这两个语句可以共享 column=value 语法，但其他问题仍然存在。]

与此问题相关的是，如果您使用触发器来检查数据（就像我一样），则需要两个触发器（插入前和更新前），并且由于它们必须使用“新”限定符，所以您必须编写两次检查代码，每次触发一次，或者将其放入过程中。如果您使用过程，则必须将每一列作为单独的参数传递，因为该过程不能使用“新”，如果您有很多列，这会很容易出错。每列必须在 create table 语句中具有其类型，然后在检查过程的定义中再次具有其类型。一旦出现小错误，您就创建了一个微妙的、难以发现的错误。我不喜欢任何涉及两次对同一事物进行编码的方法。（这相当于非标准化。）

考虑到这个插入/更新问题，我一直在玩弄以下想法，我想要一些反馈，尤其是如果有人真的尝试过的话：

仅对占位符行使用插入，仅保存最少量的数据，并获取或设置主键。然后，将所有用户输入的数据放入更新语句中。现在，您不需要像普通更新那样“插入...重复密钥更新”。此外，您只需要在更新前触发器上检查数据，因为插入时无需检查任何内容。（来自输入表单的所有用户提供的数据都由更新处理，而不是由插入处理。）

当然，这种方法的主要缺点是对新行有两个操作：插入后跟更新，而不是插入。但是，这可能不是一个因素，因为：

插入物可能比较少见。例如，在我几年前为理查森 (德克萨斯) 学区做的学生评分应用程序中，每年只增加了几千名左右的学生，而更新了数以万计的学生，因为教师使用整个学年的系统。
在我构建的其他几个系统中，性能是无关紧要的。例如，我正在使用的当前系统只有两三个人每周只更新几个小时的数据库。负载是如此之小，以至于两个操作（插入+更新）引起的开销（插入+更新）当只有一个就足够时是微不足道的。（这仅适用于新行，请记住。）

那么，有没有人真正尝试过：插入只是为了创建一个极简的占位符行，并对所有用户提供的数据更新使用更新？

score 7 · Accepted Answer

如果我需要数据库强制执行数据有效性的“规则”，我仍然需要 INSERT 触发器和 UPDATE 触发器，因为在数据库级别，我无法保证有人不会去执行包含无效数据的 INSERT。无论如何，我倾向于同时拥有这两个触发器。

插入“占位符”行然后更新的另一个缺点是（对于可变长度记录），存在碎片的一个方面。随后的更新几乎可以保证行的长度会增加，这将导致数据库中不必要的碎片增加（如果您只是插入需要的行，则不会发生这种情况。 )

我还需要考虑占位符的 INSERT 成功但 UPDATE 失败的情况。我必须有一些额外的机制来处理这种情况。

运行单个语句会更有效率，只需插入我知道需要存在的值，而不是运行两个单独的语句（一个插入占位符行，然后第二个语句更新它。）

就个人而言，我只会使用INSERT ... ON DUPLICATE KEY UPDATE，但不会重复 UPDATE 部分中的值，我只会引用 INSERT 语句中为这些列提供的值，例如

INSERT INTO foo (a,b,c) VALUES (1,'one','won'), (2,'two','too')
   ON DUPLICATE KEY
   UPDATE a = VALUES(a)
        , b = VALUES(b)
        , c = VALUES(c)

注意：要注意此语句的一个副作用，特别是如果它主要是UPDATE被执行的。此语句将为尝试插入的每一行增加一个 AUTO_INCREMENT id。该 AUTO_INCREMENT id 值本质上将被“浪费”，因为生成的值不会插入到表中，但它会“消失”。（下一个生成的值会高一个。）

mysql - 简化 MySQL 中的更新/插入（upsert）处理

1 回答 1

Related

Reference