查询优化器通常使用数据分布摘要来估计查询处理期间生成的中间表的大小。一种流行的此类汇总方案是直方图,其中输入范围被划分为桶,并保持每个桶中落入的元组数量的累积计数。出于估计的目的,假设桶内的分布是均匀的。
下面显示了一个R
关于离散属性 a 与域的关系的直方图[1..10]
:
Bucket 1: range = [1..2] Cumulative tuple count = 6
Bucket 2: range = [3..8] Cumulative tuple count = 30
Bucket 3: range = [9..10] Cumulative tuple count = 10
自联接操作 R x R 的估计大小是多少
A) 46
B) 218
C) 248
D) 1,036
E) 5,672
解决方案中给出的答案:B
答案是如何计算的?