是否有支持将快照 sstables 转换为 csv 的方法?sstables 取自 DSE 6.8 快照。
我们有一个巨大的表 - 14 个节点集群上的 40TB 数据,需要以原子方式将其导出到 csv。那应该是一个时间点的出口。
使用 dsbulk 不是一种选择:
导出 40TB 数据需要很长时间
出口不一致。我们需要一个时间点导出 - 我们需要与导出开始时完全相同的数据。
我们想使用https://github.com/jberragan/spark-cassandra-bulkreader之类的东西来读取快照文件,但它不适用于 DSE 6.8 'bti' SSTables。
任何建议如何做到这一点?