2

我们需要在我们的项目中提供地理冗余,它有大量的数据库(2-20 TB,具体取决于客户的要求)。我们有来自网络的连续数据流入(例如每小时 1-20 GB)。

目前,我们在 RHEL (Linux) 集群上拥有带有 J2EE AppServer 的 Oracle(无 RAC)和用于存储的 SAN 磁盘,简而言之,一个 DB,多个 AppServ。

我们需要的是地理冗余。需求可以概括为,只要一切正常,我们产品的 2 个独立安装服务于 2 个不同的网络(每个服务一个)。当其中一个倒下时,另一个应该同时为两者服务。

补充笔记:

  • 我们需要一个支持 SQL 的关系数据库,因为仓储是基本需求之一。
  • 最好不要使用托管/云服务,例如:http ://aws.amazon.com/vpc/ ,因为我们的客户可能对安全/隐私非常挑剔(即使托管/云服务提供这些服务)。

打折应用程序逻辑 仅复制我的数据有哪些选项?STFW 只得出以下结果(因为我不是 DBA 专家,我的解释可能是错误的):

  • 令人惊讶的是,我找不到 Oracle 的地理冗余产品。Oracle RAC 用于本地集群(更多的是水平可伸缩性而不是冗余)。
  • MySQL在分布式时似乎只支持活动备用。我需要主动-主动。
  • Guident似乎在提供基于某些 Oracle 产品的服务,但没有产品。

谢谢——卡什亚普

4

2 回答 2

0

我想MySQL 集群应该适合你。其他多主解决方案可以在这里找到。

于 2011-10-28T17:37:50.820 回答
0

在考虑最好使用复制的地理分布式数据库时,我们必须考虑在首选 A(可用性)或 C(一致性)(存在 WAN 分区)或者 L(延迟)或 C(一致性)(没有WAN 分区)。

现在,如果您的应用程序可以容忍具有强大 WAN 骨干网的中等延迟,那么您应该寻求一致性(这是为 dbms 设计的),否则如果应用程序可以在 WAN 中偶尔过时和定期断开连接,则寻求可用性。

然后是如何确保应用程序的一致性、可用性和延迟要求的挑战。我所理解的复制 dbms 中的一致性来自同步通信,其中提供可用性主要降低一致性属性(NoSQL 系统现在提供的)。然而,确保这种 dbms 的延迟要求对于数据库和系统研究人员来说仍然是一个悬而未决的问题(我猜!!)。

在http://danweinreb.org/blog/improving-the-pacelc-taxonomy了解更多信息

What I most liked to see these kinds of questions coming up in front of the whole community. These are real requirements and we are still in lack of proper solutions for them. Moving to a new or open architecture from a system like Oracle is not a easy decision to make. It seems giants like Google is still searching for the correct answer. See http://research.google.com/archive/spanner.html

于 2013-01-06T13:54:02.557 回答