部分索引
部分索引将是完美的,甚至是部分多列索引。但是你的情况
不需要在超过 1 个月的记录中搜索值
不稳定。_ 部分索引的条件只能用于文字或IMMUTABLE
函数,即常量值。你提到Recreate it every month
,但这不符合你的定义older than one month
。你看出区别了吧?
如果您只需要当前(或上一个)月份,索引重新创建以及查询本身就会变得相当简单!
对于这个答案的其余部分,我会用你的定义“不超过一个月” 。我以前不得不处理这样的情况。以下解决方案最适合我:
将索引条件基于固定时间戳,并在查询中使用相同的时间戳来说服查询规划器它可以使用部分索引。这种部分将在很长一段时间内保持有用,只是它的有效性会随着新行的添加和旧行退出您的时间范围而下降。索引将返回越来越多的误报,附加WHERE
子句必须从查询中消除这些误报。重新创建索引以更新其条件。
给定您的测试表:
CREATE TABLE mytbl (
value text
,creation_date timestamp
);
创建一个非常简单的IMMUTABLE
SQL 函数:
CREATE OR REPLACE FUNCTION f_mytbl_start_ts()
RETURNS timestamp AS
$func$
SELECT '2013-01-01 0:0'::timestamp
$func$ LANGUAGE sql IMMUTABLE;
在部分索引的条件下使用函数:
CREATE INDEX mytbl_start_ts_idx ON mytbl(value, creation_date)
WHERE (creation_date >= f_mytbl_start_ts());
value
先来。在dba.SE上的相关答案中进行了解释。
@Igor 在评论中的输入让我改进了我的答案。部分多列索引应该可以更快地排除部分索引中的误报 - 索引条件的本质是它总是越来越过时(但仍然比没有它好得多)。
询问
像这样的查询将使用索引并且应该非常快:
SELECT value
FROM mytbl
WHERE creation_date >= f_mytbl_start_ts() -- !
AND creation_date >= (now() - interval '1 month')
AND value = 'foo';
WHERE
看似多余的子句的唯一目的是:creation_date >= f_mytbl_start_ts()
让查询规划器使用部分索引。
您可以手动删除和重新创建函数和索引。
全自动化
或者你可以在一个更大的方案中自动化它,可能有很多类似的表:
免责声明:这是高级的东西。您需要知道自己在做什么,并考虑 用户权限、可能的SQL 注入和并发负载较大的锁定问题!
这个“指导表”在你的政权中每张桌子都有一行:
CREATE TABLE idx_control (
tbl text primary key -- plain, legal table names!
,start_ts timestamp
);
我会将所有这些元对象放在一个单独的模式中。
对于我们的示例:
INSERT INTO idx_control(tbl, value)
VALUES ('mytbl', '2013-1-1 0:0');
“指导表”提供了额外的好处,您可以在一个中心位置概览所有此类表及其各自的设置,并且您可以同步更新其中的部分或全部。
每当您start_ts
在此表中进行更改时,以下触发器就会启动并处理其余部分:
触发功能:
CREATE OR REPLACE FUNCTION trg_idx_control_upaft()
RETURNS trigger AS
$func$
DECLARE
_idx text := NEW.tbl || 'start_ts_idx';
_func text := 'f_' || NEW.tbl || '_start_ts';
BEGIN
-- Drop old idx
EXECUTE format('DROP INDEX IF EXISTS %I', _idx);
-- Create / change function; Keep placeholder with -infinity for NULL timestamp
EXECUTE format('
CREATE OR REPLACE FUNCTION %I()
RETURNS timestamp AS
$x$
SELECT %L::timestamp
$x$ LANGUAGE SQL IMMUTABLE', _func, COALESCE(NEW.start_ts, '-infinity'));
-- New Index; NULL timestamp removes idx condition:
IF NEW.start_ts IS NULL THEN
EXECUTE format('
CREATE INDEX %I ON %I (value, creation_date)', _idx, NEW.tbl);
ELSE
EXECUTE format('
CREATE INDEX %I ON %I (value, creation_date)
WHERE creation_date >= %I()', _idx, NEW.tbl, _func);
END IF;
RETURN NULL;
END
$func$ LANGUAGE plpgsql;
扳机:
CREATE TRIGGER upaft
AFTER UPDATE ON idx_control
FOR EACH ROW
WHEN (OLD.start_ts IS DISTINCT FROM NEW.start_ts)
EXECUTE PROCEDURE trg_idx_control_upaft();
UPDATE
现在,转向台上的一个简单的校准索引和功能:
UPDATE idx_control
SET start_ts = '2013-03-22 0:0'
WHERE tbl = 'mytbl';
您可以运行 cron 作业或手动调用它。
使用索引的查询不会改变。
-> SQLfiddle。
我用一个 10k 行的小测试用例更新了小提琴来证明它是有效的。PostgreSQL 甚至会对我的示例查询进行仅索引扫描。不会比这更快。