我正在开展一个项目,该网站(所有组件都托管在 Azure 中)将同时拥有美国和国际用户。我们对 99% 的数据使用 Blob 和表存储。我不明白的是如何设置全局实例,包括多个表等,并保持一切同步。假设用户从法国登录站点,我如何确保他们始终访问同一个数据中心(这意味着相同的存储实例)?如果他们遇到不同的存储实例,他们的数据将不存在和/或陈旧。
1 回答
计算和存储都关联到特定的数据中心。没有全局计算或全局存储部署概念。
话虽如此:您通常会将面向人类的应用程序(例如 Web 应用程序)托管在单个数据中心中。通常,如果只有相对少量的数据在两者之间移动,浏览器和服务器之间的延迟就不是什么大问题。大部分带宽通常位于 Web 服务器和应用服务器和/或数据库实例之间。在 Azure 中,数据不一定需要与 Web 应用程序位于同一数据中心(尽管从延迟 + 出口带宽成本的角度来看,这是理想的场景)。
如果您想在多个数据中心进行计算,则需要有一个更高级别的机制为您执行某种类型的负载平衡(例如 Azure 的流量管理器)。但是,即使使用 Traffic Manager 的“最近”设置,您也不能真正保证法国的用户会访问西欧与北欧的数据中心。您总是必须为访问任何数据中心的访客做好计划。这就是为什么在单个数据中心处理计算要简单得多的原因。
关于数据:如果您的计算位于单个数据中心,则无需(除了灾难恢复)将数据写入多个数据中心。如果您决定将 Compute 部署到多个数据中心,您将需要自己的方法来同步数据。对于 Azure blob 和表存储,您可以考虑某种类型的命令模式(例如 CQRS),其中您的操作是队列驱动的。这允许您针对跨不同数据中心的多个存储帐户处理每个排队的数据操作。
现在,您可能会遇到数据主权问题,其中数据必须根据特定客户的地理位置驻留在特定数据中心中。同样,您需要在应用层中实现这一点。对此的一种想法是在用户设置时将其与特定数据中心关联起来(并将数据中心映射与您的 Web 层一起存储在单个数据库中)。此时,当访问者登录时,您可以轻松查找他们正确的数据中心,并在他们的浏览会话中从特定数据中心访问他们的数据。