sql - 涉及两个连接的 CTE 的奇怪行为

Question

为了让问题更容易理解，这篇文章已经完全改写了。

PostgreSQL 9.5运行的设置Ubuntu Server 14.04 LTS。

数据模型

我有数据集表，我在其中单独存储数据（时间序列），所有这些表必须共享相同的结构：

CREATE TABLE IF NOT EXISTS %s(
    Id                  SERIAL                          NOT NULL,
    ChannelId           INTEGER                         NOT NULL,
    GranulityIdIn       INTEGER,
    GranulityId         INTEGER                         NOT NULL,
    TimeValue           TIMESTAMP                       NOT NULL,
    FloatValue          FLOAT                           DEFAULT(NULL),
    Status              BIGINT                          DEFAULT(NULL),
    QualityCodeId       INTEGER                         NOT NULL,
    DataArray           FLOAT[]                         DEFAULT(NULL),
    DataCount           BIGINT                          DEFAULT(NULL),
    Performance         FLOAT                           DEFAULT(NULL),
    StepCount           INTEGER                         NOT NULL DEFAULT(0),
    TableRegClass       regclass                        NOT NULL,
    Updated             TIMESTAMP                       NOT NULL,
    Tags                TEXT[]                          DEFAULT(NULL),
    --
    CONSTRAINT          PK_%s                           PRIMARY KEY(Id),
    CONSTRAINT          FK_%s_Channel                   FOREIGN KEY(ChannelId)          REFERENCES scientific.Channel(Id),
    CONSTRAINT          FK_%s_GranulityIn               FOREIGN KEY(GranulityIdIn)      REFERENCES quality.Granulity(Id),
    CONSTRAINT          FK_%s_Granulity                 FOREIGN KEY(GranulityId)        REFERENCES quality.Granulity(Id),
    CONSTRAINT          FK_%s_QualityCode               FOREIGN KEY(QualityCodeId)      REFERENCES quality.QualityCode(Id),
    CONSTRAINT          UQ_%s                           UNIQUE(QualityCodeId, ChannelId, GranulityId, TimeValue)
);

CREATE INDEX IDX_%s_Channel   ON %s USING btree(ChannelId);
CREATE INDEX IDX_%s_Quality   ON %s USING btree(QualityCodeId);
CREATE INDEX IDX_%s_Granulity ON %s USING btree(GranulityId) WHERE GranulityId > 2;
CREATE INDEX IDX_%s_TimeValue ON %s USING btree(TimeValue);

此定义来自 a FUNCTION，因此%s代表数据集名称。

约束确保给UNIQUE定数据集中不能有重复记录。此数据集中的记录是floatvalue给定通道 ( ) 的值 ( )，在给定时间 ( ) 在给定间隔 ( ) 上channelid采样，具有给定质量 ( )。无论值是什么，都不能有的副本。timevaluegranulityidqualitycodeid(channelid, timevalue, granulityid, qualitycodeid)

数据集中的记录如下所示：

1;25;;1;"2015-01-01 00:00:00";0.54;160;6;"";;;0;"datastore.rtu";"2016-05-07 16:38:29.28106";""
2;25;;1;"2015-01-01 00:30:00";0.49;160;6;"";;;0;"datastore.rtu";"2016-05-07 16:38:29.28106";""
3;25;;1;"2015-01-01 01:00:00";0.47;160;6;"";;;0;"datastore.rtu";"2016-05-07 16:38:29.28106";""

我还有另一个卫星表，我在其中存储频道的有效数字，这个参数可以随时间变化。我以以下方式存储它：

CREATE TABLE SVPOLFactor (
   Id                   SERIAL                  NOT NULL,
   ChannelId            INTEGER                 NOT NULL,
   StartTimestamp       TIMESTAMP               NOT NULL,
   Factor               FLOAT                   NOT NULL,
   UnitsId              VARCHAR(8)              NOT NULL,
   --
   CONSTRAINT           PK_SVPOLFactor          PRIMARY KEY(Id),
   CONSTRAINT           FK_SVPOLFactor_Units    FOREIGN KEY(UnitsId)        REFERENCES Units(Id),
   CONSTRAINT           UQ_SVPOLFactor          UNIQUE(ChannelId, StartTimestamp)
);

当为通道定义了有效数字时，会在此表中添加一行。然后该因素自该日期起适用。第一条记录始终具有标记值'-infinity'::TIMESTAMP，这意味着：该因子从一开始就适用。接下来的行必须有一个实际定义的值。如果给定通道没有行，则表示有效数字是单一的。

此表中的记录如下所示：

123;277;"-infinity";0.1;"_C"
124;1001;"-infinity";0.01;"-"
125;1001;"2014-03-01 00:00:00";0.1;"-"
126;1001;"2014-06-01 00:00:00";1;"-"
127;1001;"2014-09-01 00:00:00";10;"-"
5001;5181;"-infinity";0.1;"ug/m3"

目标

我的目标是对由不同进程填充的两个数据集进行比较审计。为了实现它，我必须：

比较数据集之间的记录并评估它们的差异；
检查相似记录之间的差异是否包含在有效数字内。

为此，我编写了以下查询，其行为方式我不理解：

WITH

-- Join records before records (regard to uniqueness constraint) from datastore templated tables in order to make audit comparison:
S0 AS (
SELECT
    A.ChannelId
   ,A.GranulityIdIn AS gidInRef
   ,B.GranulityIdIn AS gidInAudit
   ,A.GranulityId AS GranulityId
   ,A.QualityCodeId
   ,A.TimeValue
   ,A.FloatValue AS xRef
   ,B.FloatValue AS xAudit
   ,A.StepCount AS scRef
   ,B.StepCount AS scAudit
   ,A.DataCount AS dcRef
   ,B.DataCount AS dcAudit
   ,round(A.Performance::NUMERIC, 4) AS pRef
   ,round(B.Performance::NUMERIC, 4) AS pAudit
FROM
    datastore.rtu AS A JOIN datastore.audit0 AS B USING(ChannelId, GranulityId, QualityCodeId, TimeValue)
),

-- Join before SVPOL factors in order to determine decimal factor applied to records:
S1 AS (
SELECT
    DISTINCT ON(ChannelId, TimeValue)
    S0.*
   ,SF.Factor::NUMERIC AS svpolfactor
   ,COALESCE(-log(SF.Factor), 0)::INTEGER AS k
FROM
    S0 LEFT JOIN settings.SVPOLFactor AS SF ON ((S0.ChannelId = SF.ChannelId) AND (SF.StartTimestamp <= S0.TimeValue))
ORDER BY
    ChannelId, TimeValue, StartTimestamp DESC
),

-- Audit computation:
S2 AS (
SELECT
    S1.*
   ,xaudit - xref AS dx
   ,(xaudit - xref)/NULLIF(xref, 0) AS rdx
   ,round(xaudit*pow(10, k))*pow(10, -k) AS xroundfloat
   ,round(xaudit::NUMERIC, k) AS xroundnum
   ,0.5*pow(10, -k) AS epsilon
FROM S1
)

SELECT
    *
   ,ABS(dx) AS absdx
   ,ABS(rdx) AS absrdx
   ,(xroundfloat - xref) AS dxroundfloat
   ,(xroundnum - xref) AS dxroundnum
   ,(ABS(dx) - epsilon) AS dxeps
   ,(ABS(dx) - epsilon)/epsilon AS rdxeps
   ,(xroundfloat - xroundnum) AS dfround
FROM
    S2
ORDER BY
    k DESC
   ,ABS(rdx) DESC
   ,ChannelId;

该查询可能有点不可读，我大致期望它：

使用唯一性约束连接来自两个数据集的数据以比较相似记录并计算差异（S0）；
对于每个差异，找到LEFT JOIN适用于当前时间戳 ( ) 的有效数字 ( S1)；
执行一些其他有用的统计数据（S2和最终SELECT的）。

问题

当我运行上面的查询时，我缺少行。例如：两个表（和）channelid=123共有12 条记录。当我执行整个查询并将其存储在 a中时，只有不到 12 行。然后我开始调查以了解为什么我丢失了记录，并且我遇到了一个奇怪的子句行为。如果我执行这个查询，我得到：granulityid=4datastore.rtudatastore.audit0MATERIALIZED VIEWWHEREEXPLAIN ANALIZE

"Sort  (cost=332212.76..332212.77 rows=1 width=232) (actual time=6042.736..6157.235 rows=61692 loops=1)"
"  Sort Key: s2.k DESC, (abs(s2.rdx)) DESC, s2.channelid"
"  Sort Method: external merge  Disk: 10688kB"
"  CTE s0"
"    ->  Merge Join  (cost=0.85..332208.25 rows=1 width=84) (actual time=20.408..3894.071 rows=63635 loops=1)"
"          Merge Cond: ((a.qualitycodeid = b.qualitycodeid) AND (a.channelid = b.channelid) AND (a.granulityid = b.granulityid) AND (a.timevalue = b.timevalue))"
"          ->  Index Scan using uq_rtu on rtu a  (cost=0.43..289906.29 rows=3101628 width=52) (actual time=0.059..2467.145 rows=3102319 loops=1)"
"          ->  Index Scan using uq_audit0 on audit0 b  (cost=0.42..10305.46 rows=98020 width=52) (actual time=0.049..108.138 rows=98020 loops=1)"
"  CTE s1"
"    ->  Unique  (cost=4.37..4.38 rows=1 width=148) (actual time=4445.865..4509.839 rows=61692 loops=1)"
"          ->  Sort  (cost=4.37..4.38 rows=1 width=148) (actual time=4445.863..4471.002 rows=63635 loops=1)"
"                Sort Key: s0.channelid, s0.timevalue, sf.starttimestamp DESC"
"                Sort Method: external merge  Disk: 5624kB"
"                ->  Hash Right Join  (cost=0.03..4.36 rows=1 width=148) (actual time=4102.842..4277.641 rows=63635 loops=1)"
"                      Hash Cond: (sf.channelid = s0.channelid)"
"                      Join Filter: (sf.starttimestamp <= s0.timevalue)"
"                      ->  Seq Scan on svpolfactor sf  (cost=0.00..3.68 rows=168 width=20) (actual time=0.013..0.083 rows=168 loops=1)"
"                      ->  Hash  (cost=0.02..0.02 rows=1 width=132) (actual time=4102.002..4102.002 rows=63635 loops=1)"
"                            Buckets: 65536 (originally 1024)  Batches: 2 (originally 1)  Memory Usage: 3841kB"
"                            ->  CTE Scan on s0  (cost=0.00..0.02 rows=1 width=132) (actual time=20.413..4038.078 rows=63635 loops=1)"
"  CTE s2"
"    ->  CTE Scan on s1  (cost=0.00..0.07 rows=1 width=168) (actual time=4445.910..4972.832 rows=61692 loops=1)"
"  ->  CTE Scan on s2  (cost=0.00..0.05 rows=1 width=232) (actual time=4445.934..5312.884 rows=61692 loops=1)"
"Planning time: 1.782 ms"
"Execution time: 6201.148 ms"

而且我知道我必须有 67106 行。

在撰写本文时，我知道S0返回正确数量的行。所以问题肯定出在更远的地方CTE。

我发现真正奇怪的是：

EXPLAIN ANALYZE
WITH

S0 AS (
SELECT * FROM datastore.audit0
),

S1 AS (
SELECT
    DISTINCT ON(ChannelId, TimeValue)
    S0.*
   ,SF.Factor::NUMERIC AS svpolfactor
   ,COALESCE(-log(SF.Factor), 0)::INTEGER AS k
FROM
    S0 LEFT JOIN settings.SVPOLFactor AS SF ON ((S0.ChannelId = SF.ChannelId) AND (SF.StartTimestamp <= S0.TimeValue))
ORDER BY
    ChannelId, TimeValue, StartTimestamp DESC
)

SELECT * FROM S1 WHERE Channelid=123 AND GranulityId=4 -- POST-FILTERING

返回 10 行：

"CTE Scan on s1  (cost=24554.34..24799.39 rows=1 width=196) (actual time=686.211..822.803 rows=10 loops=1)"
"  Filter: ((channelid = 123) AND (granulityid = 4))"
"  Rows Removed by Filter: 94890"
"  CTE s0"
"    ->  Seq Scan on audit0  (cost=0.00..2603.20 rows=98020 width=160) (actual time=0.009..26.092 rows=98020 loops=1)"
"  CTE s1"
"    ->  Unique  (cost=21215.99..21951.14 rows=9802 width=176) (actual time=590.337..705.070 rows=94900 loops=1)"
"          ->  Sort  (cost=21215.99..21461.04 rows=98020 width=176) (actual time=590.335..665.152 rows=99151 loops=1)"
"                Sort Key: s0.channelid, s0.timevalue, sf.starttimestamp DESC"
"                Sort Method: external merge  Disk: 12376kB"
"                ->  Hash Left Join  (cost=5.78..4710.74 rows=98020 width=176) (actual time=0.143..346.949 rows=99151 loops=1)"
"                      Hash Cond: (s0.channelid = sf.channelid)"
"                      Join Filter: (sf.starttimestamp <= s0.timevalue)"
"                      ->  CTE Scan on s0  (cost=0.00..1960.40 rows=98020 width=160) (actual time=0.012..116.543 rows=98020 loops=1)"
"                      ->  Hash  (cost=3.68..3.68 rows=168 width=20) (actual time=0.096..0.096 rows=168 loops=1)"
"                            Buckets: 1024  Batches: 1  Memory Usage: 12kB"
"                            ->  Seq Scan on svpolfactor sf  (cost=0.00..3.68 rows=168 width=20) (actual time=0.006..0.045 rows=168 loops=1)"
"Planning time: 0.385 ms"
"Execution time: 846.179 ms"

下一个返回正确的行数：

EXPLAIN ANALYZE
WITH

S0 AS (
SELECT * FROM datastore.audit0
WHERE Channelid=123 AND GranulityId=4 -- PRE FILTERING
),

S1 AS (
SELECT
    DISTINCT ON(ChannelId, TimeValue)
    S0.*
   ,SF.Factor::NUMERIC AS svpolfactor
   ,COALESCE(-log(SF.Factor), 0)::INTEGER AS k
FROM
    S0 LEFT JOIN settings.SVPOLFactor AS SF ON ((S0.ChannelId = SF.ChannelId) AND (SF.StartTimestamp <= S0.TimeValue))
ORDER BY
    ChannelId, TimeValue, StartTimestamp DESC
)

SELECT * FROM S1

在哪里：

"CTE Scan on s1  (cost=133.62..133.86 rows=12 width=196) (actual time=0.580..0.598 rows=12 loops=1)"
"  CTE s0"
"    ->  Bitmap Heap Scan on audit0  (cost=83.26..128.35 rows=12 width=160) (actual time=0.401..0.423 rows=12 loops=1)"
"          Recheck Cond: ((channelid = 123) AND (granulityid = 4))"
"          Heap Blocks: exact=12"
"          ->  BitmapAnd  (cost=83.26..83.26 rows=12 width=0) (actual time=0.394..0.394 rows=0 loops=1)"
"                ->  Bitmap Index Scan on idx_audit0_channel  (cost=0.00..11.12 rows=377 width=0) (actual time=0.055..0.055 rows=377 loops=1)"
"                      Index Cond: (channelid = 123)"
"                ->  Bitmap Index Scan on idx_audit0_granulity  (cost=0.00..71.89 rows=3146 width=0) (actual time=0.331..0.331 rows=3120 loops=1)"
"                      Index Cond: (granulityid = 4)"
"  CTE s1"
"    ->  Unique  (cost=5.19..5.28 rows=12 width=176) (actual time=0.576..0.581 rows=12 loops=1)"
"          ->  Sort  (cost=5.19..5.22 rows=12 width=176) (actual time=0.576..0.576 rows=12 loops=1)"
"                Sort Key: s0.channelid, s0.timevalue, sf.starttimestamp DESC"
"                Sort Method: quicksort  Memory: 20kB"
"                ->  Hash Right Join  (cost=0.39..4.97 rows=12 width=176) (actual time=0.522..0.552 rows=12 loops=1)"
"                      Hash Cond: (sf.channelid = s0.channelid)"
"                      Join Filter: (sf.starttimestamp <= s0.timevalue)"
"                      ->  Seq Scan on svpolfactor sf  (cost=0.00..3.68 rows=168 width=20) (actual time=0.006..0.022 rows=168 loops=1)"
"                      ->  Hash  (cost=0.24..0.24 rows=12 width=160) (actual time=0.446..0.446 rows=12 loops=1)"
"                            Buckets: 1024  Batches: 1  Memory Usage: 6kB"
"                            ->  CTE Scan on s0  (cost=0.00..0.24 rows=12 width=160) (actual time=0.403..0.432 rows=12 loops=1)"
"Planning time: 0.448 ms"
"Execution time: 4.510 ms"

因此问题似乎出在S1. 没有为定义有效数字channelid = 123，因此，不应在没有的情况下生成这些记录LEFT JOIN。但这并不能解释为什么会有一些缺失。

问题

我在这个查询中做错了什么？

当我获取有效数字时，我使用LEFT JOIN它来保持正确的基数，因此它不能删除记录，之后它只是算术。

预过滤如何返回比后过滤更多的行？

这对我来说听起来有点麻烦。如果我不使用WHERE子句，则会生成所有记录（或组合）（我知道这JOIN是一个WHERE子句），然后进行计算。当我不使用其他WHERE（原始查询）时，我会错过行（如示例中所示）。当我添加 WHERE 子句进行过滤时，结果会有所不同（如果后过滤返回的记录多于预过滤，这可能很好）。

欢迎任何指出我的错误和对查询的误解的建设性答案。谢谢你。

score 2 · Accepted Answer

发生了什么

由于. DISTINCT ON_ S1看来您正在使用它来仅选择SVPOLFactor. 然而，你写

DISTINCT ON(ChannelId, TimeValue)

而在查询S0中，唯一行也可能因GranulityId和/或不同而不同QualityCodeId。因此，例如，如果您在这两列中都有行，rtu并且audit0具有以下列：

 Id | ChannelId | GranulityId |      TimeValue      | QualityCodeid 
----|-----------+-------------+---------------------+---------------
  1 |       123 |           4 | 2015-01-01 00:00:00 |             2
  2 |       123 |           5 | 2015-01-01 00:00:00 |             2

那么S0没有WHERE过滤将返回这两个的行，因为它们在GranulityId. 但是其中之一将被DISTINCT ONin 子句删除S1，因为它们具有相同的值ChannelId和TimeValue。更糟糕的是，因为您只使用ChannelIdand进行排序TimeValue，所以选择哪一行和删除哪一行并不是由查询中的任何内容决定的——它是由机会决定的！

在您的 "post-filtering" 示例中WHERE ChannelId = 123 AND GranulityId = 4，这两行都在S0. 然后，根据您无法真正控制的顺序，有可能DISTINCT ONinS1过滤掉第 1 行而不是第 2 行。然后，第 2 行在最后被过滤掉，让您没有任何行。子句中的错误DISTINCT ON导致您甚至不想看到的第 2 行在中间查询中删除第 1 行。

在您的“预过滤”示例中S0，您在第 2 行干扰第 1 行之前将其过滤掉，因此第 1 行使其进入最终查询。

一个修复

阻止这些行被排除的一种方法是扩展DISTINCT ONandORDER BY子句以包含GranulityIdand QualityCodeId：

DISTINCT ON(ChannelId, TimeValue, GranulityId, QualityCodeId)
-- ...
ORDER BY ChannelId, TimeValue, GranulityId, QualityCodeId, StartTimestamp DESC

当然，如果您过滤的结果以S0使它们对于其中一些列具有相同的值，则可以省略DISTINCT ON. S0在您使用ChannelIdand进行预过滤的示例中GranulityId，这可能是：

DISTINCT ON(TimeValue, QualityCodeId)
-- ...
ORDER BY TimeValue, QualityCodeId, StartTimestamp DESC

但是我怀疑这样做会节省很多时间，因此保留所有这些列可能是最安全的，以防有一天您再次更改查询并忘记更改DISTINCT ON.

我想提一下PostgreSQL 文档警告这些问题DISTINCT ON（强调我的）：

所有 [ DISTINCT ON] 表达式都相等的一组行被认为是重复的，并且只有该组的第一行保留在输出中。请注意，除非查询在足够多的列上排序以保证到达DISTINCT过滤器的行的唯一顺序，否则集合的“第一行”是不可预测的。（DISTINCT ON处理发生在ORDER BY排序之后。）

该DISTINCT ON子句不是 SQL 标准的一部分，由于其结果可能具有不确定性，因此有时被认为是不好的样式。明智地使用GROUP BY和中的子查询FROM，可以避免这种结构，但它通常是最方便的替代方案。

score 2 · Accepted Answer

你已经得到了一个正确的答案，这只是一个补充。当您在派生表中计算开始/结束时，连接返回单行并且您不需要DISTINCT ON（这也可能更有效）：

...
FROM S0 LEFT JOIN
 ( 
   SELECT *,
      -- find the next StartTimestamp = End of the current period 
      COALESCE(LEAD(StartTimestamp) 
               OVER (PARTITION BY ChannelId
                     ORDER BY StartTimestamp, '+infinity') AS EndTimestamp
   FROM SVPOLFactor AS t
 ) AS SF 
ON  (S0.ChannelId = SF.ChannelId)
AND (S0.TimeValue >= SF.StartTimestamp)
AND (S0.TimeValue < SF.EndTimestamp)

score 0 · Accepted Answer

由于操作顺序不同，它们实际上是两个逻辑上不同的查询，DISTINCT ON(ChannelId, TimeValue) ... ORDER BY ChannelId, TimeValue, StartTimestamp 并且WHERE Channelid=123 AND GranulityId=4. 看着

create table sample(
  distinctkey int,
  orderkey int,
  valkey int
);

 insert into sample (distinctkey,orderkey,valkey)
 select 1,10,150
 union all
 select 1,20,100;

还有两个与您类似的查询：

select distinctkey, orderkey, valkey
from (
  select distinct on(distinctkey) distinctkey, orderkey, valkey
  from sample 
  order by distinctkey, orderkey) t
where distinctkey = 1 and valkey = 100;

不返回任何行。尽管

select distinct on(distinctkey) distinctkey, orderkey, valkey
from (
  select distinctkey, orderkey,valkey
  from sample 
  where distinctkey = 1 and valkey = 100) t
order by distinctkey, orderkey;

返回 1 行。

同样，您的查询可能会根据数据返回不同数量的行。您应该只选择一个与您面临的任务相关的逻辑。

sql - 涉及两个连接的 CTE 的奇怪行为

3 回答 3

发生了什么

一个修复

Related

Reference