2

在其他统计软件 (STATA) 中,当您在两个单独的表之间执行连接时,可以选择报告连接结果

例如,如果您在列上将一个表与另一个表连接,并且第二个表具有非唯一值,则它会报告这一点。

同样,如果您执行内连接,它会报告从两个表中删除的行数,如果您执行左外连接或右外连接,它会让您知道有多少行不匹配。

4

2 回答 2

1

它需要一个讨厌的外部连接。这是 CTE 版本:

-- Some data
CREATE TABLE bob
        ( ID INTEGER NOT NULL
        , zname varchar
        );
INSERT INTO bob(id, zname) VALUES
 (2, 'Alice') ,(3, 'Charly')
,(4,'David') ,(5, 'Edsger') ,(6, 'Fanny')
        ;
CREATE TABLE john
        ( ID INTEGER NOT NULL
        , zname varchar
        );
INSERT INTO john(id, zname) VALUES
 (4,'David') ,(5, 'Edsger') ,(6, 'Fanny')
,(7,'Gerard') ,(8, 'Hendrik') ,(9, 'Irene'), (10, 'Joop')
        ;

 --
 -- Encode presence in bob as 1, presence in John AS 2, both=3
 --
WITH flags AS (
        WITH b AS (
                SELECT 1::integer AS flag, id
                FROM bob
                )
        , j AS (
                SELECT 2::integer AS flag, id
                FROM john
                )
        SELECT COALESCE(b.flag, 0) + COALESCE(j.flag, 0) AS flag
        FROM b
        FULL OUTER JOIN j ON b.id = j.id
        )
SELECT flag, COUNT(*)
FROM flags
GROUP BY flag;

结果:

CREATE TABLE
INSERT 0 5
CREATE TABLE
INSERT 0 7
 flag | count 
------+-------
    1 |     2
    3 |     3
    2 |     4
(3 rows)
于 2012-07-21T12:44:51.643 回答
0

据我所知,在 Postgres 中没有这样做的选项,尽管您可以通过查看估计值来猜测。

计算丢失的行需要您计算所有行,因此数据库通常会尽量避免这样的事情。

我能想到的选项:

  • 编写多个查询
  • 进行完整的外部联接并过滤结果(也许使用子查询......想不出一个总是很容易工作的好方法)
  • 使用可写的复杂表表达式来记录中间结果
于 2012-07-20T18:59:16.443 回答