postgresql - timescaledb 是否支持窗口函数？

Question

我正在尝试使用 TimescaleDB 扩展来计算一些连续聚合。我有这个工作正常的查询：

SELECT distinct time_bucket('1 hour', entry_ts) as date_hour,
                type_id,
                entry_id,
                exit_id,
                count(*) OVER (partition by time_bucket('1 hour', entry_ts), entry_id, exit_id, type_id) AS total,
                ((count(*) over (partition by time_bucket('1 hour', entry_ts), entry_id, exit_id, type_id)) * 100)::numeric /
                (count(*) over (partition by time_bucket('1 hour', entry_ts), entry_id)) percentage_of_entry
FROM transits

当我尝试将其放在连续聚合物化视图中时，出现错误：

CREATE MATERIALIZED VIEW transits_hourly
            WITH (timescaledb.continuous) AS
SELECT distinct time_bucket('1 hour', entry_ts) as date_hour,
                type_id,
                entry_id,
                exit_id,
                count(*) OVER (partition by time_bucket('1 hour', entry_ts), entry_id, exit_id, type_id) AS total,
                ((count(*) over (partition by time_bucket('1 hour', entry_ts), entry_id, exit_id, type_id)) * 100)::numeric /
                (count(*) over (partition by time_bucket('1 hour', entry_ts), entry_id)) percentage_of_entry
FROM transits
WITH NO DATA

我得到的错误是：

ERROR:  invalid continuous aggregate view
SQL state: 0A000

TimescaleDB 是否允许按时间窗口在分区上进行连续聚合？

我在 PostgreSQL 12.5 上使用 TimescaleDB 2.1。

score 5 · Accepted Answer

TimescaleDB 是 PostgreSQL 扩展，并允许 PostgreSQL 的大部分功能。对超表上的 SELECT 语句没有已知限制。

但是，连续聚合支持有限的查询，因此它可以增量地维护物化而不是刷新整个物化，这将是昂贵的。基本上查询应该允许独立于其他组处理每个聚合组，因此DISTINCT不允许使用窗口函数。

创建连续聚合的文档包含一个注释小节，其中列出了 SELECT 语句的限制。尤其是：

不允许使用 ORDER BY、DISTINCT 和 FILTER 子句的聚合。

窗口函数不能与连续聚合一起使用。

解决限制的可能方法：

使用允许的 SELECT 语句创建一个连续聚合，然后在其上定义一个视图，该视图将计算最终结果。这可以减少最终视图要处理的数据量，但执行起来仍然很昂贵。
创建一个物化视图并创建自动刷新它，例如，在自定义作业的帮助下。但是，刷新将重新计算整个物化。
如果您对如何计算部分数据的查询有很好的了解，您可以将插入脚本写入另一个表，该表将专门用于存储物化。然后，可以通过例如自定义作业来实现实现自动化。

postgresql - timescaledb 是否支持窗口函数？

1 回答 1

Related

Reference