一个常见的操作是在不存在时插入新行,或者更新现有行。不幸的是,insert 和 update SQL 语句的语法完全不同:Insert 采用列列表,后跟相应的值列表,而 update 采用 column=value 对的列表。MySQL "insert...on duplicate key update" 语句(它的 upsert 语句)不能解决这个问题,因为它仍然需要完整的插入列/值列表,然后是完整的更新列/值列表。[更新:下面 Wrikken 的评论指出,这两个语句可以共享 column=value 语法,但其他问题仍然存在。]
与此问题相关的是,如果您使用触发器来检查数据(就像我一样),则需要两个触发器(插入前和更新前),并且由于它们必须使用“新”限定符,所以您必须编写两次检查代码,每次触发一次,或者将其放入过程中。如果您使用过程,则必须将每一列作为单独的参数传递,因为该过程不能使用“新”,如果您有很多列,这会很容易出错。每列必须在 create table 语句中具有其类型,然后在检查过程的定义中再次具有其类型。一旦出现小错误,您就创建了一个微妙的、难以发现的错误。我不喜欢任何涉及两次对同一事物进行编码的方法。(这相当于非标准化。)
考虑到这个插入/更新问题,我一直在玩弄以下想法,我想要一些反馈,尤其是如果有人真的尝试过的话:
仅对占位符行使用插入,仅保存最少量的数据,并获取或设置主键。然后,将所有用户输入的数据放入更新语句中。现在,您不需要像普通更新那样“插入...重复密钥更新”。此外,您只需要在更新前触发器上检查数据,因为插入时无需检查任何内容。(来自输入表单的所有用户提供的数据都由更新处理,而不是由插入处理。)
当然,这种方法的主要缺点是对新行有两个操作:插入后跟更新,而不是插入。但是,这可能不是一个因素,因为:
插入物可能比较少见。例如,在我几年前为理查森 (德克萨斯) 学区做的学生评分应用程序中,每年只增加了几千名左右的学生,而更新了数以万计的学生,因为教师使用整个学年的系统。
在我构建的其他几个系统中,性能是无关紧要的。例如,我正在使用的当前系统只有两三个人每周只更新几个小时的数据库。负载是如此之小,以至于两个操作(插入+更新)引起的开销(插入+更新)当只有一个就足够时是微不足道的。(这仅适用于新行,请记住。)
那么,有没有人真正尝试过:插入只是为了创建一个极简的占位符行,并对所有用户提供的数据更新使用更新?