Pagerank作用于一系列页面的节点图和由它们各自的向内和向外链接形成的有向边。因此,特定页面的排名大致是节点图中的局部诱导效应。
另一方面,SVD适用于整个值矩阵,并且没有方向性 - 站点 A 和站点 B 之间的链接只会在正确的矩阵元素上注册为 1。它是一个全球系统,所以排名是一个全球效应。
鉴于网络衍生矩阵的极端稀疏性,我认为 SVD 在这里表现不佳,因为它需要完整的数据集,并且需要大量内存。
真的吗?Pagerank 是否在很大程度上超过了 SVD,因为它是一种基于节点图的算法?Pagerank 如何从页面中推断出超出单词被提及次数的语义相关性?或者这是在 Pagerank 对页面进行排名之后执行的第二步?