1

我正在从我的站点创建数据转储以供其他人下载和分析。每个转储都将是一个巨大的 XML 文件。

我试图找出最好的压缩算法:

  • 有效压缩(CPU 方面)
  • 制作尽可能小的文件
  • 相当普遍

我知道压缩的基础知识,但不知道哪种算法符合要求。我将使用 MySQL 和 Python 来生成转储,所以我需要一个好的 Python 库。

4

1 回答 1

3

对于大多数情况,具有标准压缩级别的 GZIP 应该没问题。更高的压缩级别=更多的 CPU 时间。BZ2 包装更好,但速度也较慢。好吧,在 CPU 消耗/运行时间和压缩效率之间总是需要权衡取舍……所有具有默认压缩级别的压缩都应该没问题。

于 2011-05-20T05:38:11.477 回答