1

这是数据的格式:

item_name | item_serial | sub_group | conc_stuff | other_data | more_data
----------+-------------+-----------+------------+------------+-----------
foo        bar-01-a      widget      b-3          towel        dent
foo        bar-02-a      widget      a-1          42           mouse
foo        bar-03-a      widget      p-1          babel        dolphin
foo3       bar-21-f      widget      f-1          42           marvin
foo3       bar-22-f      widget      x-1          poetry       vogon

我已经让查询按照我想要的方式执行,问题是我需要返回更多数据。

SELECT item_name, 
       array_to_string(array_agg(conc_stuff), ',') as stuff 
FROM dataset 
WHERE some_selector = 'X' 
GROUP BY item_name 
ORDER BY item_name;

我尝试了对我来说似乎简单但合乎逻辑的方法:

SELECT item_name, 
       item_serial, 
       sub_group, 
       array_to_string(array_agg(conc_stuff), ',') as stuff 
FROM dataset 
WHERE some_selector = 'X' 
GROUP BY item_name 
ORDER BY item_name;

我需要返回如下所示的内容:

item_name | item_serial | sub_group |   stuff
----------+-------------+-----------+-------------
foo        bar-01-a      widget      a-1,b-3,p-1
foo3       bar-21-f      widget      f-1,x-1,g-5
foo6       bar-81-z      widget      r-1,d-8,w-0

而不仅仅是这个:

item_name |   stuff
----------+--------------
foo        a-1,b-3,p-1
foo3       f-1,x-1,g-5
foo6       r-1,d-8,w-0

当我尝试向查询添加其他字段时,我得到:

ERROR: column "stuff.item_serial" must appear in the GROUP BY clause or be used in an aggregate function

但是我不想GROUP BYitem_serial,我只是希望它与聚合一起返回,对吗?

我需要运行子查询吗?我相信这很简单。如果有多种方法,哪种方法最有效?我将连接的一些文本是坐标(大字符串文本)。

4

2 回答 2

2

您需要为您拥有的每个名称选择一个值。您不能让每个名称只返回一次,但item_serial多次返回值。

通过聚合函数从存在的值中选择一个值作为组值:

SELECT item_name,
       min(item_serial),
       min(sub_group),
       array_to_string(array_agg(conc_stuff),',') AS stuff
FROM dataset
WHERE sub_group = 'widget'
GROUP BY item_name
ORDER BY item_name;

这会选择“第一个”item_serialsub_group每个名称。

如果您想要最后一个值,请max改用。

但要理解的重要一点是,您必须为未分组的列选择一个值。您需要通过提供一个选择一个值的聚合函数来准确地告诉 DBMS 它应该使用哪一个。

SQLFiddle 示例:http ://www.sqlfiddle.com/#!1/58009/1

于 2012-09-11T20:17:42.417 回答
1

在这方面,Postgres 8.4 比 Pg 的最新版本要严格一些。使用 a 时GROUP BY,需要对所有不包含聚合函数的字段进行分组。

从 Pg9.1 开始,如果您使用GROUP BY主键,则可以省略所有其他非分组字段。

希望能帮助到你。

编辑:

SELECT 
  item_name, 
  item_serial, 
  sub_group, 
  array_to_string(array_agg(conc_stuff), ',') as stuff 
FROM 
  dataset 
WHERE 
  some_selector = 'X' 
GROUP BY 
  item_name,
  item_serial,
  sub_group 
ORDER BY 
  item_name;
于 2012-09-11T19:03:33.410 回答