5

情况如下:
我有一个带有 datetime 参数的表值函数,例如 tdf(p_date),它过滤大约 200 万行,选择列 date 小于 p_date 的行,并计算其他列的一些聚合值。
它工作得很好,但如果 p_date 是一个自定义标量值函数(在我的例子中返回一天结束),执行计划就会改变,查询从 1 秒到 1 分钟执行时间。

概念证明表 - 1K 产品,2M 行:

CREATE TABLE [dbo].[POC](
    [Date] [datetime] NOT NULL,
    [idProduct] [int] NOT NULL,
    [Quantity] [int] NOT NULL
) ON [PRIMARY]

内联表值函数:

CREATE FUNCTION tdf (@p_date datetime)
RETURNS TABLE 
AS
RETURN 
(
    SELECT idProduct, SUM(Quantity) AS TotalQuantity,
         max(Date) as LastDate
    FROM POC
    WHERE (Date < @p_date)
    GROUP BY idProduct
)

标量值函数:

CREATE FUNCTION [dbo].[EndOfDay] (@date datetime)
RETURNS datetime
AS
BEGIN
    DECLARE @res datetime
    SET @res=dateadd(second, -1,
         dateadd(day, 1, 
             dateadd(ms, -datepart(ms, @date),
                 dateadd(ss, -datepart(ss, @date),
                    dateadd(mi,- datepart(mi,@date),
                         dateadd(hh, -datepart(hh, @date), @date))))))
    RETURN @res
END

查询 1 - 工作得很好

SELECT * FROM [dbo].[tdf] (getdate())

执行计划结束:Stream Aggregate Cost 13% <--- Clustered Index Scan Cost 86%

查询 2 - 不太好

SELECT * FROM [dbo].[tdf] (dbo.EndOfDay(getdate()))

执行计划结束:Stream Aggregate Cost 4% <--- Filter Cost 12% <--- Clustered Index Scan Cost 86%

4

2 回答 2

6

开销是您的标量函数。

这里的 TVF 像内联宏一样扩展,所以

SELECT * FROM [dbo].[tdf] (getdate())

变成

SELECT     idProduct, SUM(Quantity) AS TotalQuantity, max(Date) as LastDate
    FROM         POC
    WHERE     Date < getdate()
    GROUP BY idProduct

当您使用日终标量函数时,SQL 无法将 EOD(GETDATE()) 评估为常量。抱歉,我无法快速找到关于 SQL 如何评估这些内容的文章。

我猜它正在为每一行进行评估,而不是你想要的预先评估。

我会单独计算 EOD 声明:

DECLARE @eod datetime;
SET @eod = dbo.EndOfDay(getdate());
SELECT * FROM [dbo].[tdf] (@eod)

我也将它用于 EOD 功能:

DATEADD(second, -1, DATEADD(day, 1, (DATEDIFF(day, 0, @date))))

编辑:我回答的其他问题

于 2009-01-16T14:03:45.430 回答
1

您也可以将 EndOfDay 重写为内联 UDF,并使用嵌套的内联 UDF。例子:

许多嵌套的内联 UDF 非常快

使用内联 UDF 计算每月的第三个星期三

于 2009-07-08T18:41:56.450 回答