0

自 Vnodes 与 Cassandra 1.2 一起发布以来已经过去了一年。我已经阅读了几篇描述此功能的 Datastax 文章,他们说该功能很棒,但我想问问那些在生产中使用它的人:

  1. 它真的稳定并准备好投入生产了吗?
  2. 修复运行时修复速度和磁盘使用开销如何?对我们来说非常重要
  3. 再平衡速度怎么样?
  4. 在启用 Cassandra vnodes 的情况下使用 Hadoop 稳定性/性能如何?
  5. 什么时候应该避免使用 vnode?
  6. 我们每个节点有 1.5Tb,RF=3。当我打开 vnodes 时,所有数据都会重新分配吗?我关心的是网络
4

1 回答 1

2

我无法回答您的所有问题,但这是我可以提供的帮助。

  1. 修复仅受 vnode 的轻微影响。假设每个节点有 256 个令牌,则修复任务的数量是 256 倍,每个任务小 256 倍。除了非常少量的数据之外,创建额外任务的额外开销可以忽略不计。所以我认为你不会注意到修复 1.5 TB 数据有什么不同。

  2. 您不需要使用 vnode 重新平衡。当您添加和删除节点时,集群会保持平衡。

  3. 升级到 vnode 是最大的挑战。几乎所有数据都需要重新分配。这可以通过 shuffle(实际上效果不佳,因此不推荐)、停用和引导每个节点(让一个节点临时存储所有数据的副本)或复制硬件并创建一个新的来完成虚拟数据中心,然后退役旧的数据中心。

于 2013-10-14T08:28:47.347 回答