我在查询具有父/子关系行的表时遇到问题。在编写一个简化示例时,我意识到 stackexchange 模式非常相似。
所以想象一下,我正在通过 stackexchange 数据浏览器查询 stackoverflow 帖子表。我正在尝试获取所有帖子及其相关答案的子集。
帖子的子集在视图中定义,该视图具有相当复杂和昂贵的查询计划。在下面的示例中,它已被简化为简单地选择前两行。
第一种方式,使用联合:
with ExpensiveView as (select top 2 ID from Posts order by ID)
select Posts.*
from ExpensiveView
left outer join Posts
ON ExpensiveView.Id = Posts.Id
union all
select Posts.*
from ExpensiveView
left outer join Posts
ON ExpensiveView.Id = Posts.ParentId
我很想避免这种方式,因为ExpensiveView
被评估了两次。对于上面的简化版本显然不是问题,但会导致更复杂的问题。
第二种方式,使用带有条件连接子句的单选:
with ExpensiveView as (select top 2 ID from Posts order by ID)
select Posts.*
from ExpensiveView
left outer join Posts
ON ExpensiveView.Id = Posts.Id or ExpensiveView.Id = Posts.ParentId
这避免了ExpensiveView
被评估两次,但会导致非常大的聚集索引扫描。它似乎正在扫描每个 ID 中的整个索引ExpensiveView
(因此 2 * 14977623 = ~3000 万行)。这是非常缓慢的。
两个问题
为什么第二个查询中的条件连接会导致如此大的索引扫描?
ExpensiveView
有什么方法可以在不被多次评估的情况下获得我正在寻找的结果?