2

如果我想计算指向自身的节点和悬空节点的 PageRank 值,我删除悬空节点并且初始(和最终)PageRank 将为 1?

4

1 回答 1

1

原始的 Page Rank 算法不允许自循环。然而,有一些变体要么明确添加自环,要么考虑链接结构中存在的那些。

所以这里我们有一个完整的网络(或我们爬过的网络),只包含两个节点。A 有一个自循环和另一个到 B 的链接。B 没有链接。这导致最终 PR 向量中的值为 0。MMDS 书 (Ullman) 提出了几个选项:(1) 递归删除死胡同,或 (2) 添加税收参数。 在此处输入图像描述 在您的示例中,我们可以删除第二个节点。见图二。现在我们只剩下一个带有自循环的节点了。请记住,已删除的节点尚未获得 0 分。比方说,如果您的实现假定将自循环计为一个内链接,那么现在 A 的 PR 分数为 1。B 有一个后继者 (A) 会对此做出贡献。A 有两个外链(你的循环假设,加上到 B 的链接)。见图三。所以最后我们得到 B 的 PR 为 0.5

请注意,PageRank 的总和超过 1,它们不再代表随机冲浪者的分布。然而,它们确实代表了对页面相对重要性的体面估计。*Ullman MMDS,第 172-173 页,第 9-10 页,pdf 格式。

书籍参考:http: //infolab.stanford.edu/~ullman/mmds/ch5.pdf

于 2015-06-04T08:12:10.323 回答