3

Single-Region Spanner 以 99.99% 的可用性 SLA 进行宣传。在基于美国的配置中,每个节点将恰好有三个副本,全部位于爱荷华州康瑟尔布拉夫斯。您能否分享一些信息来解释为什么 99.99%(每年约一小时的停机时间)是可信的,尤其是在发生地理局部灾难的情况下?我假设谷歌已经做了彻底的分析,否则它不会宣传 SLA,但我找不到详细的论文。

如果发生区域故障,Google 将执行哪些恢复程序以及恢复时间/预期数据丢失时间?

(我知道多区域可能是可用的,并且已经看到了一些定价数据,但这里不会讨论这个)。

4

1 回答 1

1

Spanner 自动复制数据以实现高可用性。正如您所说,区域实例具有三个完整的数据副本。关键是它们在区域内的三个区域中复制,这些区域具有独立的电源、冷却、网络等。区域通常彼此独立失败,因此即使一个区域出现故障,您的其他副本也可以继续提供读取和写入服务。多区域通过跨区域复制提供了更高的可用性。

区域故障非常罕见,并且对您的应用程序是透明的;Cloud Spanner 会自动将请求重新路由到能够为请求提供服务的副本。一个地区因数据丢失而崩溃的情况更加罕见。谷歌采取了许多措施来应对灾难。

更进一步,我们将公开托管备份,但这些备份仍将存储在 Google 数据中心内。如果您想管理自己的备份,我们还在开发 Dataflow 连接器以帮助您导入/导出数据。

于 2017-06-06T20:08:53.780 回答