41

使用 PostgreSQL,我有一些看起来像这样的查询:

SELECT <col 1>, <col 2>
     , (SELECT sum(<col x>)
        FROM   <otherTable> 
        WHERE  <other table foreignkeyCol>=<this table keycol>) AS <col 3>
FROM   <tbl>

鉴于子选择在每种情况下都是相同的,有没有办法将该子选择存储为表中的伪列?本质上,我希望能够从表 A 中选择一列,该列是表 B 中记录相关的特定列的总和。这可能吗?

4

4 回答 4

87

有没有办法将该子选择存储为表中的伪列?

一个VIEWlike被建议是一个完全有效的解决方案。去吧。

但是还有另一种更适合您的问题的方法。您可以编写一个将表类型作为参数的函数来模拟“计算字段”“生成的列”

考虑这个来自您的描述的测试用例:

CREATE TABLE tbl_a (a_id int, col1 int, col2 int);
INSERT INTO tbl_a VALUES (1,1,1), (2,2,2), (3,3,3), (4,4,4);

CREATE TABLE tbl_b (b_id int, a_id int, colx int);
INSERT INTO tbl_b VALUES
  (1,1,5),  (2,1,5),  (3,1,1)
, (4,2,8),  (5,2,8),  (6,2,6)
, (7,3,11), (8,3,11), (9,3,11);

创建模拟的函数col3

CREATE FUNCTION col3(tbl_a)
  RETURNS int8
  LANGUAGE sql STABLE AS
$func$
SELECT sum(colx)
FROM   tbl_b b
WHERE  b.a_id = $1.a_id
$func$;

现在可以查询:

SELECT a_id, col1, col2, tbl_a.col3
FROM   tbl_a;

甚至:

SELECT *, a.col3 FROM tbl_a a;

注意我是如何写tbl_a.col3/a.col3的,而不仅仅是col3. 这是必不可少的。

Oracle 中的“虚拟列”不同,它不会自动包含在SELECT * FROM tbl_a. 你可以使用 a VIEW

为什么这行得通?

引用表列的常用方法是使用属性表示法

从 tbl_a 中选择tbl_a.col1

调用函数的常用方法是使用函数表示法

选择col3(tbl_a) ;

一般来说,最好坚持这些符合 SQL 标准的规范方式。

但是 Postgres 也允许使用属性表示法。这些也有效:

从 tbl_a 中选择col1(tbl_a);
选择tbl_a.col3

更多关于手册中的内容。
你现在可能已经看到了,这是怎么回事。这看起来像你会添加一个额外的表列,tbl_acol3()实际上是一个函数,它将当前行tbl_a(或其别名)作为行类型参数并计算一个值。

SELECT *, a.col3
FROM   tbl_a AS a;

如果存在实际列col3,则它具有优先权,并且系统不会以该行tbl_a作为参数来查找该名称的函数。

它的“美”:您可以添加或删除列,tbl_a最后一个查询将动态返回所有当前列,其中视图只会返回在创建时存在的列(早期绑定与后期绑定*)。
当然,您现在必须先删除依赖函数,然后才能删除表。并且在对表进行更改时,您必须注意不要使函数无效。

我还是不会用。这对无辜的读者来说太令人惊讶了。

于 2012-06-23T02:19:22.223 回答
3

根据狮子的评论,显然这是用视图处理的。所以就我而言,我使用了以下命令:

CREATE VIEW <viewname> AS
SELECT *, (SELECT sum(<col x>)
FROM   <otherTable
WHERE  <otherTable foreignkeyCol>=<thisTable keycol>) AS <col 3>
FROM   <tablename>

这基本上给了我另一个表,包括所需的列。

于 2012-06-23T00:13:02.617 回答
3

除了视图之外,您还可以为总和创建一个函数。

CREATE FUNCTION sum_other_table( key type_of_key ) RETURNS bigint
AS $$ SELECT sum( col_x ) FROM table_1 where table_1.key = key $$ LANGUAGE SQL;

然后将其用作您的聚合器:

SELECT col_1, col_2, sum_other_table( key ) AS col_3
FROM table_2 WHERE table_2.key = key;

请注意, sum_other_table() 的返回类型取决于您要汇总的列的类型。

于 2012-06-23T00:15:42.240 回答
3

到目前为止,有三个答案,所有这些都有效。根据具体情况,其中任何一个都可能是“最佳解决方案”。对于小表,性能应该非常接近,但它们都不太可能很好地扩展到具有数百万行的表。使用大型数据集获得所需结果的最快方法可能是(使用 Erwin 的设置):

SELECT a_id, col1, col2, sum(colx)
FROM tbl_a LEFT JOIN tbl_b b using(a_id)
GROUP BY a_id, col1, col2;

如果a_id声明为主键,并且在 9.1 或更高版本下运行,则该GROUP BY子句可以简化,因为col1并且col2功能上依赖a_id.

SELECT a_id, col1, col2, sum(colx)
FROM tbl_a LEFT JOIN tbl_b b using(a_id)
GROUP BY a_id;

视图可以通过这种方式定义并且可以扩展,但我不认为使用函数的方法会考虑所有相同的执行路径,因此可能不会使用最快的执行路径。

于 2012-06-23T16:36:59.613 回答