0

我有一份学生和家长的名单,并希望使用学生证将他们分组。拥有共同学生证的父母可以被视为一个家庭,而拥有共同父母证的学生也可以被视为一个家庭。这是一个示例表:

 p_id | parent_name | s_id | student_name |
------------------------------------------|
 1    | John Doe    | 100 |  Mike Doe     |
 3    | Jane Doe    | 100 |  Mike Doe     |
 3    | Jane Doe    | 105 |  Lisa Doe     |
 5    | Will Willy  | 108 |  William Son  |

我想最终得到类似的东西:

     parents       |       students         |
-------------------|------------------------|
John Doe, Jane Doe |  Mike Doe, Lisa Doe    |
Will Willy         |  William Son           |

为了实现这一点,我目前正在使用:

SELECT array_agg(parents) AS parents FROM (
    SELECT array_agg(p_id) AS par_ids, array_agg(parent_name) AS parents, student_name, s_id 
    FROM (
        /* sub query */
    )b
    GROUP BY s_id, student_name
    ORDER BY parents ASC
)c
GROUP BY unnest(par_ids)
ORDER BY parents ASC

但我得到一个错误:ERROR: cannot accumulate arrays of different dimensionalitySQL state: 2202E

我怎样才能达到预期的结果?上述语句的内部查询返回:

| par_ids |       parents       |  student_name   | s_id |
--------------------------------|------------------------|
| {1,3}   | {John Doe, Jane Doe}|  Mike Doe       | 100  |
| {3}     | {Jane Doe}          |  Lisa Doe       | 105  |
| {5}     | {Will Willy}        |  William Son    | 108  |

现在将这些学生归为父母是我的难题。

4

1 回答 1

2

我已经在这里做了类似的事情(但有点复杂):https ://stackoverflow.com/a/53129510/3984221


分步演示:db<>fiddle

SELECT
    array_agg(parent_name) as parents,                -- 4
    array_agg(student_name) as students
FROM (
    SELECT DISTINCT ON (t.s_id)                       -- 3
        *
    FROM (
        SELECT
            s_id,
            array_agg(p_id) as parents                -- 1
        FROM mytable
        GROUP BY s_id
    ) s JOIN mytable t ON t.p_id = ANY(s.parents)     -- 2
    ORDER BY t.s_id, CARDINALITY(parents) DESC        -- 3
) s
GROUP BY parents
  1. 将值聚合p_id到一个数组中:

    s_id 父母
    108 {5}
    105 {3}
    100 {1,3}
  2. 在此数组上自连接原始表:

    s_id 父母 p_id 父母名字 s_id 学生姓名
    100 {1,3} 1 约翰·多伊 100 迈克·多伊
    105 {3} 3 简·多伊 100 迈克·多伊
    100 {1,3} 3 简·多伊 100 迈克·多伊
    105 {3} 3 简·多伊 105 丽莎·多伊
    100 {1,3} 3 简·多伊 105 丽莎·多伊
    108 {5} 5 威利 108 威廉·孙
  3. 删除所有重复的学生记录。剩下的应该是p_id数组最完整的记录。这可以使用DISTINCT ON(s_id)数组长度的降序来完成:

    s_id 父母 p_id 父母名字 s_id 学生姓名
    100 {1,3} 1 约翰·多伊 100 迈克·多伊
    100 {1,3} 3 简·多伊 105 丽莎·多伊
    108 {5} 5 威利 108 威廉·孙
  4. 最后,您可以按p_id数组分组并聚合两name列:

    父母 学生
    {“约翰·多伊”,“简·多伊”} {“Mike Doe”,“Lisa Doe”}
    {“威利”} {“威廉儿子”}

如果你不想得到一个数组,而是一个字符串列表,你可以使用string_agg(name_colum, ',')而不是array_agg(name_column)

于 2021-02-02T08:18:52.963 回答