1

我将向您展示 2 个场景(NB d=阻尼因子=0.5)

第一种情况:假设有 4 个节点A, B, C, D

  • B, C, D上的链接A

PageRank 是: PR(A)=0.5 + 0.5*(PR(B)+PR(C)+PR(D))

我可以解决这个等式,我会得到 0.875as 的值0.25PR(B)=PR(C)=PR(D)不需要解决任何系统

第二种情况:假设有 4 个节点A, B, C, D

  • A链接BC
  • B链接上C
  • C链接上A

这样 PageRank 将是:

PR(A)=0.5 + 0.5 * PR(C)

PR(B)=0.5 + 0.5 * ((PR(A))/(2))

PR(C)=0.5 + 0.5 * ((PR(A))/(2) + PR(B))

我必须解决这个系统才能得到结果。我不1/NPR(A), PR(B), PR(C) and PR(D)

事实上,我在互联网上搜索解决方案和值是:

$PR(A) = 14/13 = 1.07692308$

$PR(B) = 10/13 = 0.76923077$

$PR(C) = 15/13 = 1.15384615$

那么为什么在两个相似的场景中我使用两种不同的行为呢?

希望有人可以帮助我:)干杯

4

2 回答 2

1

由于第一个问题中的对称性,这两种情况是不同的:B、C 和 D 链接到同一个页面并从同一个页面链接(即它们都指向 A,而没有任何东西指向它们)。因此它们的页面排名将相同,这给您额外的约束 PR(B)=PR(C)=PR(D),使您可以轻松解决问题。

第二个问题没有对称性,必须长期解决。

于 2011-01-20T15:30:44.997 回答
1

假设一个包含四个网页的小宇宙:A、B、C 和 D。从一个页面到其自身的链接,或从一个页面到另一个页面的多个出站链接被忽略。PageRank 被初始化为所有页面的相同值。在 PageRank 的原始形式中,所有页面的 PageRank 之和是当时 Web 上的页面总数,因此本示例中的每个页面的初始 PageRank 为 1。但是,更高版本的 PageRank 和本节的其余部分,假设概率分布在 0 和 1 之间。因此,每页的初始值为 0.25。

在下一次迭代中,从给定页面转移到其出站链接目标的 PageRank 在所有出站链接中平均分配。

如果系统中仅有的链接是从页面 B、C 和 D 到 A,则每个链接将在下一次迭代时将 0.25 PageRank 转移到 A,总共 0.75。

公关(A)=公关(B)+公关(C)+公关(D)

假设页面 B 有一个指向页面 C 和 A 的链接,页面 C 有一个指向页面 A 的链接,页面 D 有指向所有三个页面的链接。因此,在下一次迭代中,页面 B 将其现有值的一半,即 0.125,转移到页面 A,另一半,或 0.125,转移到页面 C。页面 C 将其所有现有值,即 0.25,转移到唯一的它链接到的页面,A。由于 D 有三个出站链接,它会将其现有值的三分之一,或大约 0.083,转移到 A。在此迭代完成时,页面 A 的 PageRank 将为 0.458。

PR(A)= \frac{PR(B)}{2}+ \frac{PR(C)}{1}+ \frac{PR(D)}{3}.\,

换句话说,出站链接赋予的 PageRank 等于文档自身的 PageRank 分数除以出站链接的数量 L(·)。

PR(A)= \frac{PR(B)}{L(B)}+ \frac{PR(C)}{L(C)}+ \frac{PR(D)}{L(D)}。

在一般情况下,任何页面 u 的 PageRank 值都可以表示为:

PR(u) = \sum_{v \in B_u} \frac{PR(v)}{L(v)},

即页面 u 的 PageRank 值取决于集合 Bu(包含链接到页面 u 的所有页面的集合)中每个页面 v 的 PageRank 值除以来自页面 v 的链接数 L(v)。

如需进一步查询,请访问此处

于 2013-10-19T09:42:51.083 回答