23

我有一张这样的桌子,

 event_id |          date          
----------+------------------------
  1703702 | 2013-06-25 07:50:57-04
  3197588 | 2013-06-25 07:51:57-04
 60894420 | 2013-06-25 07:52:57-04
 60894420 | 2013-06-25 07:53:57-04
   183503 | 2013-06-25 07:54:57-04
 63116743 | 2013-06-25 07:55:57-04
 63110451 | 2013-06-25 07:56:57-04
 63116743 | 2013-06-25 07:57:57-04
 63116743 | 2013-06-25 07:58:57-04

我想应用滞后函数,但也应用 group by,这样我就可以找到任何特定 event_id 之间的时间间隔。

我想要这样的东西:

SELECT event_id, difference
FROM ( 
  SELECT event_id, date - lag(date) over (order by date) as
  difference FROM table GROUP BY event_id
) t;

但是,我不能将 GROUP BY 与 LAG 函数一起使用。我想要类似于以下的结果:

63116743, {120, 60}
60894420, {60}
...
...

所以第一个 id 的事件之间有一个 120 秒和 60 秒的窗口,而第二个 id 有一个 60 秒的窗口。

有没有办法做到这一点?输出格式不是太重要,只要我最终能把它变成一个数组。我正在使用 Postgres 9.1

4

1 回答 1

33
WITH diffs as (
    SELECT
        event_id,
        date - lag(date) over (partition BY event_id ORDER BY date) as difference
    FROM
        TABLE
)
SELECT
    event_id,
    array_agg( difference ) as all_diffs
FROM
    diffs
GROUP BY event_id;

应该管用。

于 2013-06-25T16:09:19.347 回答