我正在寻找能够展示单个网页重要性的算法/技术。撇开 PageRank 不谈,还有其他方法可以根据内容、结构和超链接相互进行评级吗?
我不仅在谈论从 www.foo.com 到 www.bar.com 的连接,就像 PageRank 那样,而且还从 www.foo.com/bar 到 www.foo.com/baz 等等(除了事实上调整 PageRank 以满足这些需求)
我如何“定义”重要性:我认为在这种情况下的重要性是“这一面与用户的相关程度,以及它对网站其他部分的重要性”。
例如,圣诞抽奖活动在起始页上公布,只有一个链接指向该站点,这对用户和站点来说都更重要。一个印记,它有来自每个站点的链接(因为它主要在页脚的某个地方)并不重要,尽管它有很多链接。印记作为一个“单元”对于网站来说也不重要,因为它没有为页面的目的提供任何真正的价值(= 提供信息、销售产品、一般服务等)