我正在学习高可用性、SAN 等的基础知识,因此这个问题对专家来说可能听起来很愚蠢,但如果你回答它会对我有很大帮助。假设我正在使用企业 SAN 设置。我了解任何数据库(例如 SQL)都将数据存储在存储在 SAN 上的文件中。现在,假设我启用基于阵列的复制到另一个可能位于另一个数据中心的阵列,那么我的数据库文件将在第二个数据中心中不断复制。每当第一个数据中心丢失时,我可以使用第二个数据中心的复制文件来调出数据和数据库。那么 SQL Always On、Oracle Dataguard 等各种 HA 解决方案究竟扮演了什么角色?提前非常感谢依赖的人。
2 回答
关键任务系统就是这样。关键任务。
我们对此进行了测试,并计划让它发生,但对冗余的依赖并不是真正的冗余。两个安装都是你的吗?是否涉及第三方?你能承受多少天(或几个小时)额外的延迟?
安德鲁,卡特里娜飓风,桑迪。如果不只是您,您在第三方的优先级列表中有多高?它们可能在承诺上是多头的蓝筹股,但在地面上摊薄时交付不足。
当您确实恢复时,将会出现异常、死信,并且可能需要一段时间才能确认最终的一致性。从功能上讲,您可能还好,但您的品牌可能会受损,您的股价可能会贬值。
最终,它满足的要求反过来又由实际需求或风险缓解策略驱动。我敢肯定它卖给了不需要它的人。但对于这样做的人来说,100% 的正常运行时间是绝对的,而不是年度报告中的一环。由于这些原因,这些产品被积极推销给“C”套件。
当您构建 IT 解决方案时,需要考虑的一些要求是您的 IT 解决方案需要基于业务流程关键性的弹性。您需要考虑解决方案的两个方面。
高可用性(HA):它决定了您的应用程序需要具有多大的弹性,通常以 9(9)表示,例如 99.99% 的可用性称为 4 个 9 的可用性,相当于大约一小时的计划外停机时间。在 Oracle 中,这通常是通过使用 oracle 真实应用程序集群 ( RAC ) 来实现的,即使在集群中的节点出现故障的情况下,它也可以为您提供可用性。在 SQL Server 中,这将是 SQL Server 可用性组。
灾难恢复(DR):确定在发生灾难时提供业务连续性的方法和技术,换句话说,当您的应用程序高可用性 (HA) 功能不再响应请求时。在 Oracle 中,这将是一个数据卫士,将您的数据库从一个数据中心的一个集群复制到远程位置的第二个集群。SQL Server 还提供了类似的功能,例如日志传送、alwas-on 和可用性组。灾难恢复能力可以通过两个指标来衡量: 恢复时间目标(RTO),它决定了在主数据中心丢失的情况下备份站点需要多长时间才能完全正常运行。以及确定业务数据丢失容限的恢复时间目标(RPO)。