4

我想知道当我在 Cassandra 的列族中插入一个新列时,磁盘上究竟存储了多少字节。我的主要问题是,当使用 Snappy 压缩列时,我需要知道这些信息,我知道原始字节的计算,但是由于数据的可变性,我无法正确估计压缩率。任何有关在 Cassandra 代码库中哪里可以找到这么多字节的信息都将受到欢迎。

提前致谢。

4

1 回答 1

2

压缩永远无法提供有保证的压缩比。您可以获得的最佳结果是样本数据的平均比率。

因此,获取大量样本数据,将其插入测试实例,并测量磁盘使用情况。

您可能拥有使用 Snappy 压缩得很差的数据,并且实际上导致磁盘使用量比存储原始字节多。

当涉及到数据压缩时,只有一个规则:MEASURE

于 2012-11-26T09:58:59.100 回答