postgresql - 时间戳与当前时间的部分索引

Question

我有一个查询，我通过比较五个月前的插入时间戳来过滤行。

该字段不会更新，如果有帮助，我们可能会认为它是不可变的。

CREATE TABLE events (
    id serial PRIMARY KEY,
    inserted_at timestamp without time zone DEFAULT now() NOT NULL
);

SELECT *
FROM events e
WHERE e.inserted_at >= (now() - '5 minutes'::interval);

并且EXPLAIN ANALYZE VERBOSE：

Seq Scan on public.events e  (cost=0.00..459.00 rows=57 width=12) (actual time=0.738..33.127 rows=56 loops=1)
    Output: id, inserted_at
    Filter: (e.inserted_at >= (now() - '5 minutes'::interval))
    Rows Removed by Filter: 19944
Planning time: 0.156 ms
Execution time: 33.180 ms

似乎 PostgreSQL 在字段上执行序列扫描，这增加了成本。

我是否有机会创建 B-tree 部分索引或其他任何东西来优化该查询？

score 2 · Accepted Answer

最后 5 分钟的部分索引将需要每隔一段时间重建一次。您可以使用 cron 同时构建它（因为您的关系正在密集使用），删除旧索引。当然，这种方法可以让您更快地选择最后插入的数据，但考虑到至少每 5 分钟您必须重新扫描表以构建短部分索引的事实。

解决方法是数学 - 您可以分阶段拆分索引构建（作为函数）：

select now()- inserted_at >= '5 minutes'::interval
from events 
where id > (currval('events_id_seq') - 5*(1000000/30))

那就是让 id 低于最后一个 id 值减去最后 5 分钟插入的近似值。

如果结果为真，则在具有相同数学的动态查询中建立索引，如果不是，则扩大步骤。

这样你只扫描 PK 以在时间戳上建立索引 - 会便宜得多。

还有一点——如果你应用这样的计算，你可能根本不需要部分索引？...

postgresql - 时间戳与当前时间的部分索引

1 回答 1

Related

Reference