我们的用例是将批量数据加载到我们的实时生产 Cassandra 集群中。我们必须每天在 Cassandra 中加载批量数据。我们遇到了 sstableloader。我们几乎没有相同的疑问:
1:当我们使用 sstableloader 将批量数据加载到我们的实时生产集群中时,我们是否有可能发生脏读?(基本上 sstableloader 是一次加载所有数据还是在获取数据时继续更新?)脏读在我们的生产环境中是不可接受的。
2:当我们将批量数据加载到我们的直播生产集群时,是否会影响集群可用性?(基本上我们正在将大量数据加载到直播生产集群中,是否会影响其性能?我们需要增加集群节点吗?在批量加载期间使其高度可用?)
3:如果使用 sstableloader 在实时生产集群中存在脏读的可能性,请建议可以避免此问题的替代工具。我们希望所有批量数据立即出现,而不是增量数据。
谢谢!