我创建了一个“合并”函数,它应该根据现有数据执行 UPDATE 或 INSERT 查询。这个函数没有为每个表编写一个 upsert-wrapper(如在大多数可用示例中),而是采用整个 SQL 字符串。这两个 SQL 字符串都是由我们的应用程序自动生成的。
计划是这样调用函数:
-- hypothetical "settings" table, with a primary key of (user_id, setting):
SELECT merge(
$$UPDATE settings SET value = 'x' WHERE user_id = 42 AND setting = 'foo'$$,
$$INSERT INTO settings (user_id, setting, value) VALUES (42, 'foo', 'x')$$
);
下面是 merge() 函数的完整代码:
CREATE OR REPLACE FUNCTION merge (update_sql TEXT, insert_sql TEXT) RETURNS TEXT AS
$func$
DECLARE
max_iterations INTEGER := 10;
i INTEGER := 0;
num_updated INTEGER;
BEGIN
-- usually returns before re-entering the loop
LOOP
-- first try the update
EXECUTE update_sql;
GET DIAGNOSTICS num_updated = ROW_COUNT;
IF num_updated > 0 THEN
RETURN 'UPDATE';
END IF;
-- nothing was updated: try the insert, watching out for concurrent inserts
BEGIN
EXECUTE insert_sql;
RETURN 'INSERT';
EXCEPTION WHEN unique_violation THEN
-- nop; just loop and try again from the top
END;
-- emergency brake
i := i + 1;
IF i >= max_iterations THEN
RAISE EXCEPTION 'merge(): tried looping % times, giving up now.', i;
EXIT;
END IF;
END LOOP;
END;
$func$
LANGUAGE plpgsql;
它在我的测试中似乎工作得很好,但我不确定我是否没有错过任何重要的东西,特别是关于并发的 UPDATE/INSERT/DELETE 查询,这些查询可能在不使用此功能的情况下发出。我忽略了什么重要的事情吗?
我为此功能咨询的资源包括:
(编辑:目标之一是避免锁定目标表。)