3

我有一个基本表如下。

create table Orders
(
    ID INT IDENTITY(1,1) PRIMARY KEY,
    Company VARCHAR(3),
    ItemID INT,
    BoxID INT,
    OrderNum VARCHAR(5),
    Status VARCHAR(5),
    --about 10 more columns, varchars and ints and dates
)

我正在尝试优化我的所有 SQL,因为我遇到了一些死锁和一些缓慢 - 但我不是这类事情的专家!

我创建了一些索引:
在 ID(主键)上聚集。
([ItemID])
上的非聚集索引 ([BoxID])
上的非聚集索引 ([Company],[OrderNum],[Status]) 上的非聚集索引 在
其他一些列上可能还有 1 或 2 个

但我对结果并不是 100% 满意。

SELECT * FROM Orders WHERE ItemID=100

给我一个索引查找 + 一个键查找和一个嵌套循环(内连接)。我明白为什么 - 但不知道我是否应该对此采取任何措施。他们的关键查找是批次的 97%,这看起来很糟糕!

使用的每个查询都会拉回表中的每一列,但我不喜欢将每一列都包含在索引中的想法。

我现在进行更改以查询[Company] 字段中的所有内容。每个查询都将使用它,因为结果不应包含超过 1 个值。所以他们都会改变:

SELECT * FROM Orders WHERE ItemID=100    --Old
SELECT * FROM Orders WHERE Company='a' and ItemID=100    --New

但是那个执行计划给了我与不包括公司完全相同的结果(这让我感到惊讶!)。

  • 为什么上面的两个执行计划是一样的?(我目前没有[公司]的索引)

  • 是否值得将 [Company] 添加到我的所有索引中,因为它似乎使 0 与执行计划不同?

  • 我是否应该只向 [Company] 添加 1 个单一索引并保留原始索引?- 但这是否意味着每个查询都会有 2 次搜索?

  • 是否值得在我的索引中“包含”所有其他列以避免键查找?(使索引变大一吨,但可能会加快速度?)即

    CREATE NONCLUSTERED INDEX [IX_Orders_MyIndex] ON [Orders]
    ( [Company] ASC, [OrderNum] ASC, [Status] ASC )
    INCLUDE ([ID],[ItemID],[BoxID],
    [Column5],[Column6],[Column7],[Column8],[Column9],[Column10],etc)
    

如果我在 4 或 5 个索引上执行此操作,这似乎很混乱。

基本上我有 4-5 个经常运行的查询(一些选择和更新),所以我想让它尽可能高效。所有查询都将使用 [company] 字段,以及至少 1 个其他字段。我该怎么办。

任何帮助表示赞赏:)

4

1 回答 1

3

在您的执行计划中,您说查找占用了批处理的 97%。

在这种情况下,它没有任何意义,因为索引查找非常快,而且您没有那么多操作要做。

该查找实际上是您根据您指定的索引读取的记录。

为什么上面的两个执行计划是一样的?(我目前没有[公司]的索引)

Non-Clustered index on ([Company],[OrderNum],[Status])

Company仅当,OrderNumStatus出现在您的 where 子句中时才会考虑此索引。

连接索引会生成一个看起来像 0000000000000 的键,当您只传递company它时,它会创建一个不完整的键,需要对另一个值使用通配符。

它看起来有点像这样:key like 'XXX%'这个逻辑将需要一个耗时的索引扫描。

优化器将确定最好先从ItemID索引中查找和行,然后扫描这些以匹配所需公司的任何内容。

是否值得将 [Company] 添加到我的所有索引中,因为它似乎使 0 与执行计划不同?

您应该考虑使用Company索引而不是将其添加到所有索引中。复合索引可以通过减少嵌套循环的数量来加快速度,但你必须仔细考虑。

添加到此类索引的字段的顺序非常重要,它们应该按唯一性排序,以便更好地查找。此外,您永远不应该添加可能不会在查询中使用的字段。

我是否应该只向 [Company] 添加 1 个单一索引并保留原始索引?- 但这是否意味着每个查询都会有 2 次搜索?

拥有多个索引查找并不是那么糟糕,它们通常是并行的,并且只有两者的结果匹配在一起。

是否值得在我的索引中“包含”所有其他列以避免键查找?(使索引变大一吨,但可能会加快速度?)

当 where 子句中只有几个字段是可选的,或者当您使用指定的索引时有查询只选择这些字段时,这是值得的。

最后的笔记

所有索引都不相等,比较字符串(varchar)与比较数字(整数、日期时间、字节等)不同。

此外,保持它们干净也有很大帮助,如果您的索引是碎片化的,那么它们在性能增益方面几乎没有用处。

于 2013-09-25T18:50:55.377 回答