嗨,我有一个包含大量数据的 cassandra 数据库,我只使用一个节点来存储它。所以有人建议我使用多个节点。
那么如果我添加一个新节点会发生什么,数据会被复制到另一个节点还是会与另一个节点平均分配?
我是 cassandra 和数据库管理的新手。如果有人可以分享一些关于此的想法会有所帮助......这将非常有帮助
嗨,我有一个包含大量数据的 cassandra 数据库,我只使用一个节点来存储它。所以有人建议我使用多个节点。
那么如果我添加一个新节点会发生什么,数据会被复制到另一个节点还是会与另一个节点平均分配?
我是 cassandra 和数据库管理的新手。如果有人可以分享一些关于此的想法会有所帮助......这将非常有帮助
数据会被复制到另一个节点还是与另一个节点平均分配?
两个都。根据每个键空间的复制策略和复制因子,数据将被复制到其他节点。但数据也将跨节点拆分以平衡负载。加入集群的新节点自动承担偶数部分数据的责任。
PS 我建议您在添加新节点后在旧节点( http://www.datastax.com/documentation/cassandra/2.0/cassandra/operations/ops_add_node_to_cluster_t.html )上运行 [nodetool cleanup]。这将有助于清理不再属于旧节点的密钥