1

我有一个类似于非聚合数据透视表的问题,但我希望我的表包含多个结果。作为一个例子,我开始是这样的:

ID | OrganizationID | Group | Vendor | Product 
 1         3            G1      V1       P1
 2         3            G1      V2       P2
 3         3            G2      V3       P3
 4         4            G1      V1       P1
 5         4            G1      V1       P2

并且需要我的数据最终是这样的:

ID | OrganizationID | G1_V1 | G1_V2 | G2_V3
 1         3            P1      P2      P3 
 2         4            P1     NULL    NULL
 3         4            P2     NULL    NULL

我正在处理的数据大约有 700 万行,因此使用动态 sql 进行自联接已被证明非常缓慢。有什么容易我想念的吗?提前致谢!

4

1 回答 1

3

您可以使用一个通用的表表达式和一组CASE语句来获得您需要的数据透视结构;这在大多数 RDBMS 中都是一样的。

WITH cte AS (
  SELECT id, organizationid, 
         CONCAT([Group],'_',Vendor) col, 
         product,
         ROW_NUMBER() OVER (
           PARTITION BY organizationid,[group],vendor 
           ORDER BY product) rn
  FROM myTable
)
SELECT 
  organizationid,
  MAX(CASE WHEN col='G1_V1' THEN product ELSE NULL END) G1_V1,
  MAX(CASE WHEN col='G1_V2' THEN product ELSE NULL END) G1_V2,
  MAX(CASE WHEN col='G2_V3' THEN product ELSE NULL END) G2_V3
FROM cte
GROUP BY organizationid, rn;

...或者,或者,您可以使用 TSQL 的常规 PIVOT 语句来替换该CASE部分,这可能会更快,但可能不适用于所有 RDBMS;

WITH cte AS (
  SELECT id, organizationid, 
         CONCAT([Group],'_',Vendor) col, 
         product,
         ROW_NUMBER() OVER (
           PARTITION BY organizationid,[group],vendor 
           ORDER BY product) rn
  FROM myTable
)
SELECT organizationid as organizationid, 
[G1_V1], [G1_V2], [G2_V3]
FROM
(SELECT organizationid,rn,col, product FROM cte) AS SourceTable
PIVOT
(
  MAX(product) FOR col IN ([G1_V1], [G1_V2], [G2_V3])
) AS PivotTable;

一个用于测试两者的 SQLfiddle

您可以使用crosstab在 PostgreSQL 中生成类似的数据透视表,但是我没有安装了 tablefunc 模块的 PostgreSQL 数据库进行测试,因此只能链接到详细信息。

于 2014-03-17T18:46:11.760 回答