我已阅读http://en.wikipedia.org/wiki/PageRank中的解释,并且我了解页面排名是通过传入链接和传出链接计算的。
我在爬取网页并存储在数据库中时有一个爬虫,我需要一个页面排名算法。我有一个具有以下值的数据库
Title
url
content_html
outgoing_links(external domain)
internal_links(the links with same domain of the url)
你能解释一下我需要任何其他值来计算页面排名吗?请解释如何使用java计算它