0

我已经计算了网站超链接网络(大约 1000 个节点)的 pagerank 值。我使用 igraph 包在 R 中完成了此操作。

我现在想获取前 10 个 pagerank 值,并根据幂律图可视化这些前 10 个网站,以了解它们在图中的位置。

我将如何获取这些结果并将它们与幂律图进行对比(例如,以说明哪些站点位于长尾下方)。

我只是想找出一个通用的公式或技术。

值如下:

0.0810
0.0330
0.0318
0.0186
0.0161
0.0160
0.0158
0.0149
0.0136
0.0133
4

1 回答 1

0

我这样做的方法是绘制连通性的密度,并用前 10 个点覆盖该图。

假设您已经连接了所有节点:

d <- density(connectivity)
top10 <- sort(connectivity, decreasing=TRUE)[1:10]

# get the height of the density for each of the top10 nodes:
top10y <- sapply(top10, function(node) {
  diffs <- abs(node - d$x)
  yloc <- which(diffs == min(diffs))[1] # in case more than one match
  d$y[yloc]
})

# now plot
plot(d)
points(top10, top10y, col="red")

例如,我模拟了 1000 个节点的连通性以遵循正态分布:

在此处输入图像描述

于 2013-09-18T04:46:51.827 回答