Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想知道当我在 Cassandra 的列族中插入一个新列时,磁盘上究竟存储了多少字节。我的主要问题是,当使用 Snappy 压缩列时,我需要知道这些信息,我知道原始字节的计算,但是由于数据的可变性,我无法正确估计压缩率。任何有关在 Cassandra 代码库中哪里可以找到这么多字节的信息都将受到欢迎。
提前致谢。
压缩永远无法提供有保证的压缩比。您可以获得的最佳结果是样本数据的平均比率。
因此,获取大量样本数据,将其插入测试实例,并测量磁盘使用情况。
您可能拥有使用 Snappy 压缩得很差的数据,并且实际上导致磁盘使用量比存储原始字节多。
当涉及到数据压缩时,只有一个规则:MEASURE