algorithm - 动态规划：最优二叉搜索树

Question

好吧，我希望有人能给我解释一下。我正在为期末考试而学习，但我无法弄清楚一些事情。

问题是动态规划；构建最优二叉搜索树（OBST）。我一般理解动态规划，特别是这个问题的概念，但我不理解这个问题的递归形式。

我知道我们正在为这些节点的越来越多的子集构建最佳二叉搜索树，并将答案保存在表格中以避免重新计算。我还知道，当您在 a_{k} 根树时，从 a_{1} 到 a_{k-1} 的所有成功节点以及它们相应的虚构不成功节点（即树的叶子）都在左子树，然后右子树中的那些是a_{k+1}到a_{n}。

这是我不明白的方程的递归形式：

c(i, j) = min (i < k <= j) {c(i, k-1) + c(k, j) + p(k) + w(i, k-1) + w(k +j)}

其中 w(i, j) = q(i) + 从 i+1 到 j 的总和 (q(l) + p(l))。

所以在 c(i,j) 中，从左到右，我们有左子树的成本 + 右子树的成本 + 成功搜索根的概率 + w(i, k-1) + w(k +j)。

我的困惑是 c(i, k-1) 与 w(i, k-1) 有何不同。

文本是 Horowitz、Sahni 和 Rajasekeran 的计算机算法，但我也阅读了 OBST 上的 CLRS 并在线搜索，我遇到的任何内容都无法很好地解释方程中这些部分之间的差异。

score 8 · Accepted Answer

c(i,j) 表示搜索包含键 ki, ..., kj 的最优二叉搜索树的预期成本。w(i,j) 表示包含键 ki, ..., kj 的子树的概率和。对于公式：</p>

c(i, j) = min (i < k <= j) {c(i, k-1) + c(k, j) + p(k) + w(i, k-1) + w(k,j)}

如果我们选择键 k 作为根，c(i,k-1)+w(i,k-1) 表示左子树的成本。c(k,j)+w(k,j) 表示右子树的成本。p(k) 表示根 k 的成本。

注意：如果我们选择键 k 作为根，那么左子树包含键 ki, ..., k(k-1)，右子树包含键 k(k+1), ..., kj . 但我们不能简单地说：

c(i,j)=min (i < k <= j) {c(i, k-1) + c(k, j) + p(k)}

因为当我们为根选择键 k 时，生成的子树的深度增加了 1。所以 c(i,k-1)+w(i,k-1) 将是左子树的正确成本！

score 2 · Accepted Answer

这是一种计算特定深度节点的频率*深度的微妙方法。

每次将节点评估为根时，在总结其左（或右）子树时，您正在添加频率总和以增加所有子节点的深度。

例如，假设节点“A”、“B”和“C”，其中“A”是根节点，“B”是“A”的左子节点，“C”是“B”的左子节点。（没有合适的孩子让事情变得简单。）

以自下而上的方式，以叶“C”为根：

cost is Pr(C) = freqC*1  (no children)

以'B'为根：

cost = Pr(B) + Cost[C,C] + sum of children freq 
     = freqB*1 + freqC*1 + freqC*1
     = freqB*1 + freqC*2 

where Pr(B) = freqB*1
     Cost[C,C] = freqC*1
     sum of children freq = freqC*1

最后，以“A”为根：

cost = Pr(A) + Cost[C,B] + sum of children freq 
     = freqA*1 + freqB*1 + freqC*2 + freqB*1 + freqC*1
     = freqA*1 + freqB*2 + freqC*3

where Pr(A) = freqA*1
     Cost[C,B] = freqB*1 + freqC*2
     sum of children freq = freqB*1 + freqC*1

algorithm - 动态规划：最优二叉搜索树

2 回答 2

Related

Reference