sql-server - DB Engine Tuning Advisor 建议改进

Question

我们有一个表格，其中包含所有准备发送且已发送的电子邮件。该表包含超过 100 万行。

下面是查找仍然需要发送的消息的查询。5 次错误后，该消息不再尝试，需要手动修复。SentDate一直null到消息发送为止。

SELECT TOP (15) 
    ID,
    FromEmailAddress,
    FromEmailDisplayName,
    ReplyToEmailAddress,
    ToEmailAddresses,
    CCEmailAddresses,
    BCCEmailAddresses,
    [Subject],
    Body,
    AttachmentUrl
FROM sysEmailMessage
WHERE ErrorCount < 5 
AND SentDate IS NULL
ORDER BY CreatedDate

查询很慢，我认为是由于缺少索引。我已将查询提供给数据库引擎优化顾问。它建议了以下索引（以及一些我通常忽略的统计数据）：

SET ANSI_PADDING ON

CREATE NONCLUSTERED INDEX [_dta_index_sysEmailMessage_7_1703677117__K14_K1_K12_5_6_7_8_9_10_11_15_17_18] ON [dbo].[sysEmailMessage]
(
    [SentDate] ASC,
    [ID] ASC,
    [ErrorCount] ASC
)
INCLUDE (   [FromEmailAddress],
    [ToEmailAddresses],
    [CCEmailAddresses],
    [BCCEmailAddresses],
    [Subject],
    [Body],
    [AttachmentUrl],
    [CreatedDate],
    [FromEmailDisplayName],
    [ReplyToEmailAddress]) WITH (SORT_IN_TEMPDB = OFF, DROP_EXISTING = OFF, ONLINE = OFF) ON [PRIMARY]

（附带说明：该索引的建议大小为 5,850,573 KB (?)，接近 6 GB，对我来说根本没有任何意义。）

我的问题是这个建议的索引是否有意义？例如，为什么ID包含列，而查询中不需要它（据我所知）？就我对索引的了解而言，它们旨在快速查找以找到相关行。如果我必须自己设计索引，我会想出类似的东西：

SET ANSI_PADDING ON

CREATE NONCLUSTERED INDEX [index_alternative_a] ON [dbo].[sysEmailMessage]
(
    [SentDate] ASC,
    [ErrorCount] ASC
)
WITH (SORT_IN_TEMPDB = OFF, DROP_EXISTING = OFF, ONLINE = OFF) ON [PRIMARY]

优化器真的很聪明还是我的索引更有效并且可能更好？

score 1 · Accepted Answer

选择索引有两个不同的方面，查找行所需的字段（=实际索引字段），以及之后需要的字段（=包含字段）。如果你总是做前 15 行，你可以完全忽略包含的字段，因为 15 个 keylookup 会很快——将整个电子邮件添加到索引中会使它变得很大。

对于索引字段，了解有多大比例的数据符合您的条件非常重要。

假设几乎所有行的 ErrorCount < 5，您不应该在索引中包含它——但如果这是一种罕见的情况，那么最好有。

假设 SentDate 很少为 NULL，那么您应该将其作为索引的第一列。

在索引中有 CreatedDate 取决于从具有 ErrorCount 和 SentDate 条件的表中找到的平均行数。如果它很多（数千），那么将它放在那里可能会有所帮助，以便可以快速找到最新的。

但与往常一样，有几件事会影响性能，因此您应该测试不同的选项如何影响您的环境。

sql-server - DB Engine Tuning Advisor 建议改进

1 回答 1

Related

Reference