119

Gzip 格式文件(例如,使用程序创建的)使用“deflate”压缩算法,该算法与zlibgzip使用的压缩算法相同。但是,当使用 zlib 对 gzip 压缩文件进行膨胀时,该库会返回一个.Z_DATA_ERROR

如何使用 zlib 解压缩 gzip 文件?

4

3 回答 3

128

inflateInit2使用zlib 解压 gzip 格式文件,调用windowBits参数 as 16+MAX_WBITS,如下所示:

inflateInit2(&stream, 16+MAX_WBITS);

如果您不这样做,zlib 将抱怨流格式错误。默认情况下,zlib 创建带有 zlib 标头的流,并且在 inflate 上不会识别不同的 gzip 标头,除非您告诉它。尽管从头文件的 1.2.1 版本开始记录了这一点zlib.h,但它不在zlib 手册中。从头文件:

windowBits对于可选的 gzip 解码,也可以大于 15。添加 32 以windowBits启用带有自动标头检测的 zlib 和 gzip 解码,或添加 16 以仅解码 gzip 格式(zlib 格式将返回 a Z_DATA_ERROR)。如果正在解码 gzip 流,strm->adler则为 crc32 而不是 adler32。

于 2009-12-03T09:20:26.920 回答
118

Python

zlib库支持

pythonzlib模块也将支持这些。

选择windowBits

zlib可以解压缩所有这些格式:

  • (解)压缩deflate格式,使用wbits = -zlib.MAX_WBITS
  • (解)压缩zlib格式,使用wbits = zlib.MAX_WBITS
  • (解)压缩gzip格式,使用wbits = zlib.MAX_WBITS | 16

请参阅http://www.zlib.net/manual.html#Advanced(部分inflateInit2)中的文档

例子

测试数据:

>>> deflate_compress = zlib.compressobj(9, zlib.DEFLATED, -zlib.MAX_WBITS)
>>> zlib_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS)
>>> gzip_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS | 16)
>>> 
>>> text = '''test'''
>>> deflate_data = deflate_compress.compress(text) + deflate_compress.flush()
>>> zlib_data = zlib_compress.compress(text) + zlib_compress.flush()
>>> gzip_data = gzip_compress.compress(text) + gzip_compress.flush()
>>> 

明显的测试zlib

>>> zlib.decompress(zlib_data)
'test'

测试deflate

>>> zlib.decompress(deflate_data)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(deflate_data, -zlib.MAX_WBITS)
'test'

测试gzip

>>> zlib.decompress(gzip_data)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|16)
'test'

数据也与gzip模块兼容:

>>> import gzip
>>> import StringIO
>>> fio = StringIO.StringIO(gzip_data)
>>> f = gzip.GzipFile(fileobj=fio)
>>> f.read()
'test'
>>> f.close()

自动标头检测(zlib 或 gzip)

添加32windowBits将触发标头检测

>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|32)
'test'
>>> zlib.decompress(zlib_data, zlib.MAX_WBITS|32)
'test'

gzip改为使用

对于gzip带有 gzip 标头的数据,您可以gzip直接使用模块;但请记住,在引擎盖下gzip使用zlib.

fh = gzip.open('abc.gz', 'rb')
cdata = fh.read()
fh.close()
于 2014-03-10T21:06:15.950 回答
4

zlib 和 gzip 的结构不同。zlib 使用RFC 1950和 gzip 使用RFC 1952,因此具有不同的标头,但其余的具有相同的结构并遵循RFC 1951

于 2013-05-02T16:36:58.460 回答