0

我有一个business_time PERIOD如下所示的临时 DB2 表:

      id local_unit vehicle      start        end
   12389       3538   21147 2019-01-01 2019-07-01
   12389       3538   21147 2019-07-01 2019-12-31

我想修改表格并像上面那样组合行,其中所有值都相同并且 business_time 时间段相邻。结果应如下所示:

      id local_unit vehicle      start        end
   12389       3538   21147 2019-01-01 2019-12-31

解决方案还必须考虑数据中可能存在相邻的不应合并的周期。性能不是问题,因为这将是一个每年只运行几次的批处理作业。

4

1 回答 1

1

这是一个间隙和孤岛问题。如前所述,您可以使用lag()和 累积总和:

select id, local_unit, vehicle, min(start), max(end)
from (select t.*,
             sum(case when prev_end >= start then 0 else 1 end) over 
                 (partition by id, local_unit, vehicle order by start) as grp
      from (select t.*,
                   lag(end) over (partition by id, local_unit, vehicle order by start) as prev_end
            from t
           ) t
     ) t
group by id, local_unit, vehicle, grp;

lag()查找上一个结束时间。sum()正在计算没有重叠的次数——这是“孤岛”的开始。最后的逻辑只是聚合这些值。

于 2020-08-19T11:20:33.663 回答