1

我正在尝试构建一个分布式任务队列,我想知道是否有任何数据存储,它具有以下部分或全部属性。我希望拥有一个完全分散的、多节点/多主自复制数据存储集群,以避免任何单点故障。

基本的

  • 支持 Python 腌制对象作为值。
  • 执着的。

越多越好,按重要性降序排列(我不希望任何数据存储满足所有标准。:-))

  • 分散式。
  • 支持跨多个节点的同步复制。
  • 在多主配置中运行/可以在多个节点上运行。
  • 数据存储集群公开为单个服务器。
  • 循环访问/选择节点以进行读/写操作。
  • 体面的python客户端。
  • 支持 get/put 和复制中的原子性。
  • 自动故障转移
  • 体面的文档和/或活跃/乐于助人的社区
  • 显着成熟
  • 不错的读/写性能

任何建议将不胜感激。

4

1 回答 1

1

Cassandra(由 facebook 开源)几乎具有所有这些属性。有几个 Python 客户端,包括pycassa

编辑添加:

Cassandra 是完全分布式的多节点 P2P,具有可调的一致性级别(即您的复制可以是同步的或异步的或两者的混合)。客户端可以连接到任何服务器。故障转移是自动的,并且可以即时添加新服务器以实现负载平衡。Cassandra 已被 Facebook 等公司用于生产环境。有一本 O'Reilly 的书。写入性能极高,读取性能也很高。

于 2011-05-15T21:19:59.077 回答