我在思考 SQL 闭包表时遇到了一些困难,希望在理解我找到的一些示例方面得到一些帮助。
假设我有一个sample_items
使用以下分层数据调用的表:
id name parent_id
1 'Root level item #1' 0
2 'Child of ID 1' 1
3 'Child of ID 2' 2
4 'Root level item #2' 0
树结构实际上应该是这样的:
id
| - 1
| | - 2
| | - 3
| - 4
为了便于查询树(例如查找特定 id 的所有后代),我使用 Bill Karwin 在这篇出色的 SO 帖子中描述的方法调用了sample_items_closure
一个表。我还使用一个可选path_length
列来在需要时查询直接子级或父级。如果我正确理解此方法,我的闭包表数据将如下所示:
ancestor_id descendant_id path_length
1 1 0
2 2 0
1 2 1
3 3 0
2 3 1
1 3 2
4 4 0
现在的每一行在表中sample_items
都有一个条目,sample_items_closure
用于它自己和它的所有祖先。到目前为止,一切都说得通。
然而,在研究其他闭包表示例时,我遇到了一个为链接到根级别 (ancestor_id 0) 并且路径长度为 0 的每一行添加一个额外的祖先的示例。使用我上面的相同数据,这就是闭包表如下所示:
ancestor_id descendant_id path_length
1 1 0
0 1 0
2 2 0
1 2 1
0 2 0
3 3 0
2 3 1
1 3 2
0 3 0
4 4 0
0 4 0
为了提供更好的上下文,这是该站点上使用的选择查询,已修改以适合我的示例:
SELECT `id`,`parent_id` FROM `sample_items` `items`
JOIN `sample_items_closure` `closure`
ON `items`.`id` = `closure`.`descendant_id`
WHERE `closure`.`ancestor_id` = 2
我有两个与此方法相关的问题:
问题一:
为什么要添加一个额外的行将每个后代链接到根级别(id 0)?
问题2:
为什么这些条目的 path_length 为 0,而不是前一个祖先的 path_length+1?例如:
ancestor_id descendant_id path_length
1 1 0
0 1 1
2 2 0
1 2 1
0 2 2
3 3 0
2 3 1
1 3 2
0 3 3
4 4 0
0 4 1
奖励问题:当树的完整结构已经在闭包表中表达时,为什么某些示例仍然包含邻接列表(我的示例中的parent_id
列)?sample_items