2

在 SQLSERVER 2005 中,我使用表值函数作为对大表中的子集数据执行任意聚合的便捷方式(传递日期范围或此类参数)。

我在更大的查询中使用这些作为联合计算,我想知道查询计划优化器是否在每种情况下都能很好地与它们一起工作,或者我是否最好在更大的查询中取消嵌套这样的计算。

  1. 如果有意义,查询计划优化器是否会取消嵌套表值函数?
  2. 如果没有,您建议如何避免通过手动取消嵌套而发生的代码重复?
  3. 如果是这样,你如何从执行计划中识别出来?

代码示例:

create table dbo.customers (
    [key] uniqueidentifier
    , constraint pk_dbo_customers
        primary key ([key])
)
go

/* assume large amount of data */
create table dbo.point_of_sales (
    [key] uniqueidentifier
    , customer_key uniqueidentifier
    , constraint pk_dbo_point_of_sales
        primary key ([key])
)
go

create table dbo.product_ranges (
    [key] uniqueidentifier
    , constraint pk_dbo_product_ranges
        primary key ([key])
)
go

create table dbo.products (
    [key] uniqueidentifier
    , product_range_key uniqueidentifier
    , release_date datetime
    , constraint pk_dbo_products 
        primary key ([key])
    , constraint fk_dbo_products_product_range_key 
        foreign key (product_range_key) 
        references dbo.product_ranges ([key])
)
go

.

/* assume large amount of data */
create table dbo.sales_history (
    [key] uniqueidentifier
    , product_key uniqueidentifier
    , point_of_sale_key uniqueidentifier
    , accounting_date datetime
    , amount money
    , quantity int
    , constraint pk_dbo_sales_history
        primary key ([key])
    , constraint fk_dbo_sales_history_product_key
        foreign key (product_key)
        references dbo.products ([key])
    , constraint fk_dbo_sales_history_point_of_sale_key
        foreign key (point_of_sale_key)
        references dbo.point_of_sales ([key])
)
go

create function dbo.f_sales_history_..snip.._date_range
(
    @accountingdatelowerbound datetime,
         @accountingdateupperbound datetime
)
returns table as
return (
    select
                  pos.customer_key
        , sh.product_key
        , sum(sh.amount) amount
        , sum(sh.quantity) quantity
    from 
        dbo.point_of_sales pos
        inner join dbo.sales_history sh 
            on sh.point_of_sale_key = pos.[key]
    where
                  sh.accounting_date between 
                      @accountingdatelowerbound and 
                      @accountingdateupperbound
    group by
                  pos.customer_key
                  , sh.product_key
)
go

-- TODO: insert some data

-- this is a table containing a selection of product ranges
declare @selectedproductranges table([key] uniqueidentifier)

-- this is a table containing a selection of customers
declare @selectedcustomers table([key] uniqueidentifier)

declare @low datetime
    , @up datetime

-- TODO: set top query parameters

.

select
         saleshistory.customer_key
         , saleshistory.product_key
         , saleshistory.amount
         , saleshistory.quantity
from
         dbo.products p
         inner join @selectedproductranges productrangeselection 
             on p.product_range_key = productrangeselection.[key]
         inner join @selectedcustomers customerselection on 1 = 1
         inner join 
         dbo.f_sales_history_..snip.._date_range(@low, @up) saleshistory
             on saleshistory.product_key = p.[key]
             and saleshistory.customer_key = customerselection.[key]

我希望样本有意义。

非常感谢您的帮助!

4

2 回答 2

5

在这种情况下,它是一个“内联表值函数”,如果它有用(或视图),优化器会简单地扩展(取消嵌套)它。

如果函数被外部​​查询视为“黑匣子”,最快的方法是比较 SSMS 中显示的 IO 与分析器中的 IO。Profler 捕获 SSMS 没有的“黑盒”IO。

Adam Mechanic 的博客文章(他的书在我工作的抽屉里)

于 2008-11-22T10:02:04.800 回答
3

1)是的,使用您的语法,它确实如此。如果您碰巧使用了返回包含条件逻辑的表的 UDF,但它不会。

3) 优化器不会指出它正在优化查询的哪一部分,因为它可能认为适合将计划的块与您的函数结合起来,或者优化一些位。

于 2008-11-22T14:14:40.237 回答