在同一个查询中对同一个聚合函数的多次调用是否有关于 SQL 实现的标准?
例如,考虑以下示例,基于流行的示例模式:
SELECT Customer,SUM(OrderPrice) FROM Orders
GROUP BY Customer
HAVING SUM(OrderPrice)>1000
据推测,计算 SUM(OrderPrice) 的值需要计算时间。每次引用聚合函数都会产生此成本,还是为特定查询存储结果?
或者,这种情况下是否没有 SQL 引擎实现的标准?
在同一个查询中对同一个聚合函数的多次调用是否有关于 SQL 实现的标准?
例如,考虑以下示例,基于流行的示例模式:
SELECT Customer,SUM(OrderPrice) FROM Orders
GROUP BY Customer
HAVING SUM(OrderPrice)>1000
据推测,计算 SUM(OrderPrice) 的值需要计算时间。每次引用聚合函数都会产生此成本,还是为特定查询存储结果?
或者,这种情况下是否没有 SQL 引擎实现的标准?
尽管我使用过许多不同的 DBMS,但我只会向您展示在 SQL Server 上证明这一点的结果。考虑这个查询,它甚至在表达式中包含一个 CAST。查看查询计划,表达式sum(cast(number as bigint))
只使用一次,定义为DEFINE:([Expr1005]=SUM([Expr1006]))
.
set showplan_text on
select type, sum(cast(number as bigint))
from master..spt_values
group by type
having sum(cast(number as bigint)) > 100000
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
|--Filter(WHERE:([Expr1005]>(100000)))
|--Hash Match(Aggregate, HASH:([Expr1004]), RESIDUAL:([Expr1004] = [Expr1004]) DEFINE:([Expr1005]=SUM([Expr1006])))
|--Compute Scalar(DEFINE:([Expr1004]=CONVERT(nchar(3),[mssqlsystemresource].[sys].[spt_values].[type],0), [Expr1006]=CONVERT(bigint,[mssqlsystemresource].[sys].[spt_values].[number],0)))
|--Index Scan(OBJECT:([mssqlsystemresource].[sys].[spt_values].[ix2_spt_values_nu_nc]))
上面可能不是很明显,因为它没有显示 SELECT 结果,所以我*10
在下面的查询中添加了一个。请注意,它现在包括一个额外的步骤DEFINE:([Expr1006]=[Expr1005]*(10))
(步骤从下到上运行),这表明新表达式需要它执行额外的计算。然而,即使这是优化的,因为它不会重新计算整个表达式 - 只是,它使用 Expr1005 并将其乘以 10!
set showplan_text on
select type, sum(cast(number as bigint))*10
from master..spt_values
group by type
having sum(cast(number as bigint)) > 100000
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
|--Compute Scalar(DEFINE:([Expr1006]=[Expr1005]*(10)))
|--Filter(WHERE:([Expr1005]>(100000)))
|--Hash Match(Aggregate, HASH:([Expr1004]), RESIDUAL:([Expr1004] = [Expr1004]) DEFINE:([Expr1005]=SUM([Expr1007])))
|--Compute Scalar(DEFINE:([Expr1004]=CONVERT(nchar(3),[mssqlsystemresource].[sys].[spt_values].[type],0), [Expr1007]=CONVERT(bigint,[mssqlsystemresource].[sys].[spt_values].[number],0)))
|--Index Scan(OBJECT:([mssqlsystemresource].[sys].[spt_values].[ix2_spt_values_nu_nc]))
这很可能是所有其他 DBMS 的工作方式,至少考虑到主要的那些,即 PostgreSQL、Sybase、Oracle、DB2、Firebird、MySQL。