5

我们有一个大型 Cassandra 集群 18 服务器(在 5T 数据附近的一台服务器上)

http://docs.datastax.com/en/cassandra/2.0/cassandra/operations/ops_add_node_to_cluster_t.html - 我们在本文档之后添加了一个新节点。

添加新服务器后,我们开始清理数据的过程(nodetool cleanup)

在文档中建议:在所有新节点都运行后,在每个先前存在的节点上运行 nodetool cleanup 以删除不再属于这些节点的密钥。等待清理在一个节点上完成,然后再执行下一个)

但在我们的案例中,清理一台服务器需要将近 2 到 3 天。我的问题是我可以在多台服务器上立即开始清理,2 或 3 ...

或者它可能导致数据丢失?

更多信息。

我们使用 cassandra 2.0.13 和 vnodes 。此外,我们将文件保存在 cassandra 中。

复制因子 = 3

4

1 回答 1

6

清理不涉及任何其他节点,因此并行运行是安全的。但是,您可能希望一次运行一个以减少对性能的影响,因为清理可能会使用大量磁盘 I/O。

于 2015-06-01T04:05:05.437 回答