1

在major compaction中,将区域服务器(Hbase)中的所有sstables和所有SSTables形成tablet server(Cassandra)合并成一个大的。

如果周期来了,是否将平均 SSTables(总空间超过 1TB)合并为一个?可能有一些 SSTable 或 HFile 的范围界限将其分成几个部分 - 以确保合并操作不会“重写所有服务器”?

我的问题与此链接http://wiki.apache.org/cassandra/MemtableSSTable的“压缩”部分有关

4

1 回答 1

1

从我发现的实际情况来看,主要压缩产生的 SSTable 并没有在 Cassandra 中拆分。在这种情况下,其他 LSM-tree 数据库依赖于受干扰的文件系统,它将 SSTable(或 Hypertable 中的 HFile、CellSotre)拆分为多个文件(例如 64MB),但主要压缩要么必须将所有这些文件压缩成新的 SSTable(我认为是低效)。

如前所述,JIRA 中有一些票可以改进和重新设计 Cassandra 的压缩:

https://issues.apache.org/jira/browse/CASSANDRA-1608

您可能还想阅读我的第二个类似问题:

Cassandra 集群中每个节点有多少数据?

于 2011-01-29T21:00:40.003 回答