我们有一个大型 Cassandra 集群 18 服务器(在 5T 数据附近的一台服务器上)
http://docs.datastax.com/en/cassandra/2.0/cassandra/operations/ops_add_node_to_cluster_t.html - 我们在本文档之后添加了一个新节点。
添加新服务器后,我们开始清理数据的过程(nodetool cleanup)
在文档中建议:在所有新节点都运行后,在每个先前存在的节点上运行 nodetool cleanup 以删除不再属于这些节点的密钥。等待清理在一个节点上完成,然后再执行下一个)
但在我们的案例中,清理一台服务器需要将近 2 到 3 天。我的问题是我可以在多台服务器上立即开始清理,2 或 3 ...
或者它可能导致数据丢失?
更多信息。
我们使用 cassandra 2.0.13 和 vnodes 。此外,我们将文件保存在 cassandra 中。
复制因子 = 3