7

我们的数据库中有一个存储过程,它通过在 where 条件下连接 30 列上的 2 个表来更新表。SQL 的一般格式为:

UPDATE Target
SET col1 = Source.col1
INNER JOIN Source 
on 
ISNULL(Target.Col2, '') = ISNULL(Source.Col2, '') and
ISNULL(Target.Col3, '') = ISNULL(Source.Col3, '') and
.
.
.
ISNULL(Target.Col31, '') = ISNULL(Source.Col31, '') and 

这是查询计划。将其保存到您的 PC 并重新打开它,以便更好地扩展。

在此处输入图像描述

Source 表有 65M 记录,Target 有 165M。以前它曾经在几分钟内运行。考虑到查询的丑陋和潜在的低效,我觉得这很令人惊讶。这个月它运行了 1.5 小时,使用了 100% 的处理器,我们不得不杀死它。

任何建议如何即兴发挥以下查询并使其按时运行..?

我们在 30-col 连接条件中使用的一些列上有单列索引。

我知道 ISNULL 函数和 30 列上的连接是疯狂的,这是一个糟糕的设计。别怪我,我继承了这个经济。

不幸的是,没有时间重新设计。有什么建议么?

4

2 回答 2

5
  1. 请发布预估执行计划的截图
  2. 我怀疑以前的查询使用了哈希连接(它应该这样做),但不知何故,基数估计现在出错了,你得到了一个循环连接。在查询上打一个哈希连接提示,看看它是否修复了这个(INNER HASH JOIN)。一旦我们有了确切的计划,我们就可以说更多。
  3. 将等式更改为(A1 = A2 OR (A1 IS NULL AND A2 IS NULL))。SQL Server 实际上识别出这种模式并在内部将其转换为“完全等于没有愚蠢的空语义”。即使使用空值,您也可以通过这种方式查找索引。

如果这没有帮助,请务必执行步骤 (3) 并在 col2-col31 上创建一个覆盖索引,包括 col1。这将为您提供一个合并连接,这是在这种情况下可能最有效的计划。它真的很快。警告:这将使表的磁盘大小加倍并减慢更新速度。

于 2012-05-02T22:05:28.357 回答
0

DBa 建议我们按照查询分析器的建议添加一个包含所有 30 列的索引,其中大多数是“包含”列。这允许查询完成。下个月我们运行时,通常在 1.5 小时内运行的相同更新 SQL 并没有在 24 小时内完成。当我们运行更新统计信息时,它在一小时内完成。

于 2012-06-10T04:51:36.860 回答