nodetool snapshot
我在互联网上搜索了很多,看到了很多备份和恢复 Cassandra 集群的方法,例如Medusa
. 但我的问题是我可以dsbulk
用来备份 Cassandra 集群。它的局限性是什么?为什么没有人建议?
问问题
70 次
1 回答
4
在某些情况下可以使用它,但它不实用,因为(这是主要的,列表可能更大):
- DSBulk 对集群节点施加了额外的负载,因为它通过标准读取路径。与此相反,
nodetool snapshot
只需创建包含数据的文件的硬链接,无需额外加载节点 - 使用 DSBulk 实现增量备份更难 - 您需要为 SELECT 提供条件,该条件将仅查找自上次备份以来更改的数据,因此您需要具有时间戳列,因为您不能对值执行 WHERE 条件
writetime
功能。另外,无论如何它都需要重新扫描整个数据。另外,不可能找到删除了哪些数据。使用nodetool snapshot
,您只需比较自上次备份以来更改了哪些文件,并仅备份它们。
于 2021-09-28T17:33:40.407 回答