2

当我在带有 OUTER JOIN 的查询上使用 PostgreSQL 的CUBE时,我得到一个额外的全 NULL 行,该行无法与多维数据集自己的“所有组合”全 NULL 结果区分开来。

CREATE TABLE species
  ( id    SERIAL PRIMARY KEY,
    name  TEXT);

CREATE TABLE pet
  ( species_id INTEGER REFERENCES species(id),
    is_adult   BOOLEAN, 
    number     INTEGER)
;

INSERT INTO species VALUES
  (1, 'cat'), (2, 'dog');

INSERT INTO pet VALUES
  (1, true, 3), (1, false, 1), (2, true, 1), (null, true, 2);

好的,所以总共有 7 只宠物:

SELECT SUM(number) FROM pet;
 sum
-----
   7
(1 row)

现在看看立方体的总行:

SELECT * FROM (
        SELECT name, is_adult, SUM(number)
        FROM   pet p
        JOIN   species s ON (p.species_id = s.id)
        GROUP BY CUBE (name, is_adult)) subq
WHERE name IS NULL
AND   is_adult IS NULL;

 name | is_adult | sum
------+----------+-----
      |          |   5
(1 row)

5只宠物?哦,对了,因为不包括无物种宠物。我需要一个外部连接。

SELECT * FROM (
        SELECT name, is_adult, SUM(number)
        FROM   pet p
        LEFT OUTER JOIN   species s ON (p.species_id = s.id)
        GROUP BY CUBE (name, is_adult)) subq
WHERE name IS NULL
AND   is_adult IS NULL;

 name | is_adult | sum 
------+----------+-----
      |          |   2
      |          |   7
(2 rows)

我的多维数据集有 2 个全空行;第二个是我想要的答案。

我半明白这里发生了什么:NULL 值用于表示两种不同的事物(“多维数据集已汇总了该列的所有值”或“该行在右侧表中没有子项”)。我只是不知道如何解决它。

4

1 回答 1

5

NULL 值用于表示两种不同的事物(“多维数据集已汇总此列的所有值”或“该行在右侧表中没有子项”)。

为了区分一个空值和另一个空值,您可以使用grouping(...)函数,请参见此处的表 9-55:https ://www.postgresql.org/docs/9.6/static/functions-aggregate.html#FUNCTIONS-GROUPING-TABLE

GROUPING(args...)整数位掩码,指示当前分组集中不包含哪些参数

分组操作与分组集结合使用(参见第 7.2.4 节)来区分结果行。GROUPING 操作的参数实际上并未被计算,但它们必须与相关查询级别的 GROUP BY 子句中给出的表达式完全匹配。位被分配,最右边的参数是最低有效位;如果相应的表达式包含在生成结果行的分组集的分组标准中,则每个位为 0,否则为 1。


 name | is_adult | sum 
------+----------+-----
      |          |   2
      |          |   7

第二个是我想要的答案。

尝试这个:

SELECT name, is_adult, SUM(number)
FROM   pet p
LEFT OUTER JOIN   species s ON (p.species_id = s.id)
GROUP BY CUBE (name, is_adult)
HAVING grouping(name,is_adult) = 3

name |is_adult |sum  |
-----|---------|-----|
     |         |7    |

还请检查此查询以了解grouping函数的工作原理:

SELECT name, is_adult, SUM(number), grouping(name,is_adult)
FROM   pet p
LEFT OUTER JOIN   species s ON (p.species_id = s.id)
GROUP BY CUBE (name, is_adult)

name |is_adult |sum |grouping |
-----|---------|----|---------|
cat  |false    |1   |0        |
cat  |true     |3   |0        |
cat  |         |4   |1        |
dog  |true     |1   |0        |
dog  |         |1   |1        |
     |true     |2   |0        |
     |         |2   |1        |
     |         |7   |3        |
     |false    |1   |2        |
     |true     |6   |2        |
于 2016-12-22T19:02:51.523 回答