3

我正在尝试查询包含一character varying[]列年份的表,并将这些年份作为逗号分隔的年份范围字符串返回。年份范围将由数组中存在的连续年份确定,不连续的年份/年份范围应以逗号分隔。

数据类型是character varying[]而不是integer[]的原因是因为一些值包含ALL而不是年份列表。我们可以省略这些结果。

到目前为止,我几乎没有运气解决这个问题,因为我什至不确定从哪里开始。

有人能给我一些指导或提供一个有用的例子来说明如何解决诸如挑战之类的问题吗?

years_table例子

+=========+============================+
| id      | years                      |
| integer | character varying[]        |
+=========+============================+
| 1       | {ALL}                      |
| 2       | {1999,2000,2010,2011,2012} |
| 3       | {1990,1991,2007}           |
+---------+----------------------------+

输出目标:

示例 SQL 查询:

SELECT id, [year concat logic] AS year_ranges
FROM years_table WHERE 'ALL' NOT IN years

结果:

+====+======================+
| id | year_ranges          |
+====+======================+
| 2  | 1999-2000, 2010-2012 |
| 3  | 1990-1991, 2007      |
+----+----------------------+
4

2 回答 2

4
SELECT id, string_agg(year_range, ', ') AS year_ranges
FROM (
   SELECT id, CASE WHEN count(*) > 1
               THEN min(year)::text || '-' ||  max(year)::text 
               ELSE min(year)::text
              END AS year_range
   FROM  (
      SELECT *, row_number() OVER (ORDER BY id, year) - year AS grp
      FROM  (
         SELECT id, unnest(years) AS year
         FROM  (VALUES (2::int, '{1999,2000,2010,2011,2012}'::int[])
                      ,(3,      '{1990,1991,2007}')
               ) AS tbl(id, years)
         ) sub1
      ) sub2
   GROUP  BY id, grp
   ORDER  BY id, min(year)
   ) sub3
GROUP  BY id
ORDER  BY id

产生完全期望的结果。

如果您处理一组 varchar ( varchar[],只需将其转换为int[],然后再继续。这似乎是完全合法的形式:

years::int[]

将内部子选择替换为生产代码中源表的名称。

 FROM  (VALUES (2::int, '{1999,2000,2010,2011,2012}'::int[])
              ,(3,      '{1990,1991,2007}')
       ) AS tbl(id, years)

->

FROM  tbl

由于我们处理的是一个自然递增的数字(年份),我们可以使用快捷方式来形成连续年份的组(形成一个范围)。我从行号中减去年份本身(按年份排序)。对于连续的年份,行号和年份都增加一并产生相同的grp数字。否则,一个新的范围开始。

此处此处的手册中有关窗口功能的更多信息。

在这种情况下,plpgsql 函数可能会更快。你必须测试。这些相关答案中的示例:
连续重复/重复的有序计数
ROW_NUMBER() 显示意外值

于 2013-07-08T18:42:07.367 回答
2

SQL Fiddle不是您要求的输出格式,但我认为它可能更有用:

select id, g, min(year), max(year)
from (
    select id, year,
        count(not g or null) over(partition by id order by year) as g
    from (
        select id, year,
            lag(year, 1, 0) over(partition by id order by year) = year - 1 as g
        from (
            select id, unnest(years)::integer as year
            from years
            where years != '{ALL}'
        ) s
    ) s
) s
group by 1, 2
于 2013-07-08T18:36:38.040 回答