3

我是分布式计算的新手,但想知道页面排名算法如何跨多台机器工作。像

  1. 他们什么时候决定应该复制数据(如果需要的话),

  2. 如果不复制数据,他们会要求其他地方的服务人员给他们结果吗?

  3. 或者他们是否将“模块”发送到不同的服务(比如一个巨大的链接图的一部分)到一个服务器,另一个模块到另一个服务器并结合他们收到的结果?

  4. 我搜索了一些东西——它如何从我的国家获取页面(你知道,<insert country>只搜索来自的页面)

这不是家庭作业。只是我的一个问题。我欢迎所有想法,即使它们非常笼统或非常详细,或者不能回答我的所有问题。

现在,我几乎一无所知,我希望通过答案后知道一些事情。

4

2 回答 2

2

三头鲸:MapReduceGoogle File SystemBigTable

于 2011-09-19T11:19:03.300 回答
1

这里有一些架构的白皮书

注意:其中一些已经过时了,现在他们正在进行实时更新,这不适用于 mapreduce。

于 2011-09-19T11:53:01.683 回答