3

nodetool snapshot我在互联网上搜索了很多,看到了很多备份和恢复 Cassandra 集群的方法,例如Medusa. 但我的问题是我可以dsbulk用来备份 Cassandra 集群。它的局限性是什么?为什么没有人建议?

4

1 回答 1

4

在某些情况下可以使用它,但它不实用,因为(这是主要的,列表可能更大):

  • DSBulk 对集群节点施加了额外的负载,因为它通过标准读取路径。与此相反,nodetool snapshot只需创建包含数据的文件的硬链接,无需额外加载节点
  • 使用 DSBulk 实现增量备份更难 - 您需要为 SELECT 提供条件,该条件将仅查找自上次备份以来更改的数据,因此您需要具有时间戳列,因为您不能对值执行 WHERE 条件writetime功能。另外,无论如何它都需要重新扫描整个数据。另外,不可能找到删除了哪些数据。使用nodetool snapshot,您只需比较自上次备份以来更改了哪些文件,并仅备份它们。
于 2021-09-28T17:33:40.407 回答