我是分布式计算的新手,但想知道页面排名算法如何跨多台机器工作。像
他们什么时候决定应该复制数据(如果需要的话),
如果不复制数据,他们会要求其他地方的服务人员给他们结果吗?
或者他们是否将“模块”发送到不同的服务(比如一个巨大的链接图的一部分)到一个服务器,另一个模块到另一个服务器并结合他们收到的结果?
我搜索了一些东西——它如何从我的国家获取页面(你知道,
<insert country>
只搜索来自的页面)
这不是家庭作业。只是我的一个问题。我欢迎所有想法,即使它们非常笼统或非常详细,或者不能回答我的所有问题。
现在,我几乎一无所知,我希望通过答案后知道一些事情。