我正在尝试使用 Mapreduce 查找 Wikipedia 的内部页面排名。我在一小部分维基页面上实现了我的 Pagerank 算法。共有6349页。我使用这个公式来计算 pagerank (d = 0.85)。
我想验证所有 pagerank 的总和是否等于总页数(6349)。
到目前为止我发现了什么:
1.所有6349个页面的总页面排名为1001.26044
2.根据维基百科,如果我使用上面的公式,那么each PageRank is multiplied by N and the sum becomes N
。我将每个页面排名乘以 N (6349) 并计算总和,我得到6356789.5。
页面排名之和不等于总页数是否有原因?我应该使用第二个公式来验证吗?
注意:我运行我的 mapreduce 代码 10 次迭代以获得良好的近似值。