4

我创建了一个“合并”函数,它应该根据现有数据执行 UPDATE 或 INSERT 查询。这个函数没有为每个表编写一个 upsert-wrapper(如在大多数可用示例中),而是采用整个 SQL 字符串。这两个 SQL 字符串都是由我们的应用程序自动生成的。

计划是这样调用函数:

-- hypothetical "settings" table, with a primary key of (user_id, setting):

SELECT merge(
    $$UPDATE settings SET value = 'x' WHERE user_id = 42 AND setting = 'foo'$$,
    $$INSERT INTO settings (user_id, setting, value) VALUES (42, 'foo', 'x')$$
);

下面是 merge() 函数的完整代码:

CREATE OR REPLACE FUNCTION merge (update_sql TEXT, insert_sql TEXT) RETURNS TEXT AS
$func$
DECLARE
    max_iterations INTEGER := 10;
    i INTEGER := 0;
    num_updated INTEGER;
BEGIN
    -- usually returns before re-entering the loop
    LOOP

        -- first try the update
        EXECUTE update_sql;
        GET DIAGNOSTICS num_updated = ROW_COUNT;
        IF num_updated > 0 THEN
            RETURN 'UPDATE';
        END IF;

        -- nothing was updated: try the insert, watching out for concurrent inserts
        BEGIN
            EXECUTE insert_sql;
            RETURN 'INSERT';
        EXCEPTION WHEN unique_violation THEN
            -- nop; just loop and try again from the top
        END;

        -- emergency brake
        i := i + 1;
        IF i >= max_iterations THEN
            RAISE EXCEPTION 'merge(): tried looping % times, giving up now.', i;
            EXIT;
        END IF;

    END LOOP;
END;
$func$
LANGUAGE plpgsql;

它在我的测试中似乎工作得很好,但我不确定我是否没有错过任何重要的东西,特别是关于并发的 UPDATE/INSERT/DELETE 查询,这些查询可能在不使用此功能的情况下发出。我忽略了什么重要的事情吗?

我为此功能咨询的资源包括:

(编辑:目标之一是避免锁定目标表。)

4

1 回答 1

1

您的问题的答案取决于您的应用程序将如何访问数据库的上下文。有很多方法可以解决这个问题,正如你自己引用的 depesz 的帖子中所讨论的那样。此外,您可能还想考虑使用可写 CTE,请参见此处。还有 [问题]插入,在 PostgreSQL 中重复更新?为您的决策过程提供了一些有趣的讨论。

于 2013-09-26T20:33:59.220 回答