我想创建一个表,其中各个列的条目“透视”到列标题。该表用于报告目的 - 我的用户希望通过 Excel(使用 Microsoft Query)查询数据,问题是在 Excel 中进行数据透视会使文件变得不切实际地大且速度慢,即使对于中等大小的数据集(约 100k 数据点) )。
考虑以下示例:
CREATE TABLE tt
(
"COMMODITY" VARCHAR2(4000 BYTE),
"MARKET" VARCHAR2(4000 BYTE),
"BID_ASK" VARCHAR2(4000 BYTE),
"PRICE" NUMBER
);
INSERT INTO tt VALUES ('Gold','US','Ask',1.1);
INSERT INTO tt VALUES ('Gold','US','Bid',1);
INSERT INTO tt VALUES ('Gold','EU','Ask',1.2);
INSERT INTO tt VALUES ('Gold','EU','Bid',1.1);
INSERT INTO tt VALUES ('Oil','US','Ask',11);
INSERT INTO tt VALUES ('Oil','US','Bid',10);
INSERT INTO tt VALUES ('Oil','EU','Ask',12);
INSERT INTO tt VALUES ('Oil','EU','Bid',11);
我想要实现的输出类似于(确切的列标题并不重要):
COMMODITY 'US_Bid' 'US_Ask' 'EU_Bid' 'EU_Ask'
Gold 1 1.1 1.1 1.2
Oil 10 11 11 12
现在可以直接旋转单个列:
SELECT * FROM
(
SELECT * FROM tt
)
PIVOT
(
SUM(PRICE)
FOR MARKET IN ('US','EU')
)
这使:
COMMODITY BID_ASK 'US' 'EU'
Gold Bid 1 1.1
Oil Bid 10 11
Oil Ask 11 12
Gold Ask 1.1 1.2
根据我的研究,没有直接旋转多个列的语法。有一些相关的问题(这里、这里或这里),但我在那里找不到我的问题的直接答案。所以我想出了以下解决方案:
SELECT * FROM
(
SELECT COMMODITY, CONCAT(CONCAT(MARKET,'_'),BID_ASK) AS MARKET_BID_ASK, PRICE FROM tt
)
PIVOT
(
SUM(PRICE)
FOR MARKET_BID_ASK IN ('US_Bid','US_Ask','EU_Bid','EU_Ask')
)
这会产生所需的输出。但是,我不认为这是一个实用的解决方案,因为我必须输入的变量数量增长得太快(在我的真实数据集中,我想一次旋转更多字段,所有这些字段都有许多不同的值)。我知道存在动态枢轴,但是我不确定这是否适用于 Excel,而且我还希望使语法尽可能简单,因为用户将自己定义查询(我只想提供一个他们可以适应的模板查询)。所以我尝试查询 IN 子句中的字段名称:
SELECT * FROM
(
SELECT COMMODITY, CONCAT(CONCAT(MARKET,'_'),BID_ASK) AS MARKET_BID_ASK, PRICE FROM tt
)
PIVOT
(
SUM(PRICE)
FOR MARKET_BID_ASK IN
(
SELECT DISTINCT CONCAT(CONCAT(MARKET,'_'),BID_ASK) AS MARKET_BID_ASK FROM tt
)
)
我认为这样的解决方案可能是实用的,因为仍然可以限制查询的变量,而不必在子查询中使用 LIKE 条件列出所有连接选项。但是,尽管根据我找到的文档,子查询在这里应该是合法的,但我在此查询中收到“ORA-00936 - 缺少表达式”错误。