0

根据本文,每个集群都有自己的存储。

" 一个集群承载着数百万用户(多少取决于硬件的使用年限),并且是一组独立的服务器,包括: 前端服务器——用于检查病毒并托管与您的浏览器或邮件客户端对话的代码的服务器, 使用 POP3 和 DeltaSync 等协议 后端服务器- SQL 和文件存储服务器、垃圾邮件过滤器、监控和垃圾邮件数据的存储、目录代理和处理入站和出站邮件的服务器 负载平衡器- 用于分配负载的硬件和软件更均匀以获得更快的性能。

我猜用户分配到哪个集群取决于您的地理位置(IP 地址)。在这种情况下,如果我从德国给自己发送一封电子邮件,然后在我来到美国时检查我的电子邮件,我将被分配到不同的集群(因此不同的 SQL 数据库)。那么对于我来说,能够在美国看到那封邮件,是否意味着所有集群中的所有数据库都在不断同步?

4

1 回答 1

1

地理很可能是您分配集群的方式(将其视为内容交付网络)。我认为你的假设是正确的。

当然我不能确定这一切是如何运作的,但根据我与其他大型供应商的经验,我的想法如下:

电子邮件冗余存储在集群中(因此机器/硬盘驱动器的丢失)没有任何意义,并且这些集群也(可能)冗余存储在地理上独立的位置,从而减少大规模中断和灾难对最终用户的影响. 这种推/拉在数据集群中不断进行(想想像HDFS这样的文件系统),以确保 n 级冗余。由于您在任何给定小时内登录到不同集群中的系统的机会很小,因此不需要实时同步信息(就可用性而言),但可能在几分钟/小时的数量级,并尽可能快地运行他们的机器以确保数据的持久性。

集群设置可能类似于亚马逊:东/西海岸集群,欧洲集群,以及根据许多其他用户所在的位置,一个亚洲集群(或两个或三个)。这些之间的数据推拉不是几分钟,而是几小时。

所有这些冗余和同步对于其他服务来说都很重要,就像你提到的文章一样,skydrive 和 messenger 都共享这个 sayme 基础设施。

于 2012-06-26T06:08:05.823 回答