1

我更习惯于单独使用一个数据库(比如 PostgreSQL 或 ElasticSearch)。但目前我在原型应用程序中使用混合(PG 和 ES),并且可能会在混合中加入其他类型的数据库(例如:redis)。

假设某些数据需要以不同的方式保存到每个数据库中。 如果其中一个组件/数据库发生故障,您如何保持系统的一致性?

我面临的示例场景:PostgreSQL 上的数据更新,ElasticSearch 不可用。此时,系统不一致,因为我应该更新两个数据库。当我使用 SQL 数据库时,我可以简单地中止事务以将系统置于其先前的一致状态。

但是保持系统一致的最佳方法是什么?

  • 每次检查该值是否已保存在所有数据库中?
  • 如果失败,恢复之前的状态 ? 但是在一些 NoSQL 数据库中没有事务/ACID 机制,所以我不能轻易地恢复到以前的状态。

另外,如果多个数据库必须保持同步,是否有任何好的做法,比如添加某种“版本”元数据(无论是时间戳还是自制的递增版本号),这样您就可以使您的数据库重新同步?(不谈论内置的 CouchDB!)

此外,数据库并非全部自动更新,因此某些部分在短时间内不一致。我认为这取决于应用程序的业务,但有人对我发生的问题或解决方法有一些想法吗?我想这一定很艰难,并且取决于很多配置(可能很少有真正的好处)。

我想这可能是一个常见的架构问题,但我很难找到有关该主题的信息。

4

2 回答 2

4
  1. 保持简单。
  2. 搜索引擎有时会并且会落后。你可能会与之抗争。你可以拥抱它。没关系,而且大多数时候都可以接受。
  3. 不要混合数据。如果您使用 Redis 进行会话 - 很好。不要将数据库 A 中的内容存储在 B 中,反之亦然。
  4. 为您的 Super Important Business Data™® 选择具有 ACID 和强一致性的适当数据库。
  5. 同样,不要混合数据。
于 2014-02-20T15:52:51.280 回答
2

在一个产品中使用不止一种数据库技术是一个不应该轻易做出的决定。您使用的技术越多,您的项目在开发、部署、维护和管理中就会变得越复杂。此外,每种数据库技术都将成为一个单独的故障点。这意味着坚持一种技术通常更明智,即使这意味着您需要做出一些妥协。

但是,当您有充分的(!)理由使用多个 DBMS 时,您应该尽量将它们分开。避免将相关数据放置在多个数据库中。如果可能,任何功能都不应需要多个 DBMS 才能工作(最好 DBMS 的故障只会影响使用它的那些功能)。还应避免在两个不同的 DBMS 中存储冗余数据。

当您无法避免跨越多个 DBMS 的冗余和关系时,您应该决定将一个系统作为唯一的事实来源(最好是您最信任的关于一致性的系统)。当系统之间存在不一致时,应通过将数据与 SSOT 同步来解决。

于 2014-02-19T18:25:01.770 回答