所以这就是问题所在。我有大约 60KB 大小的 sample.gz 文件。我想解压这个文件的前 2000 个字节。我遇到了 CRC check failed 错误,我猜是因为 gzip CRC 字段出现在文件末尾,它需要整个 gzip 文件解压缩。有没有办法解决这个问题?我不关心CRC检查。即使我因为 CRC 错误而无法解压,也没关系。有没有办法解决这个问题并解压缩部分 .gz 文件?
我到目前为止的代码是
import gzip
import time
import StringIO
file = open('sample.gz', 'rb')
mybuf = MyBuffer(file)
mybuf = StringIO.StringIO(file.read(2000))
f = gzip.GzipFile(fileobj=mybuf)
data = f.read()
print data
遇到的错误是
File "gunzip.py", line 27, in ?
data = f.read()
File "/usr/local/lib/python2.4/gzip.py", line 218, in read
self._read(readsize)
File "/usr/local/lib/python2.4/gzip.py", line 273, in _read
self._read_eof()
File "/usr/local/lib/python2.4/gzip.py", line 309, in _read_eof
raise IOError, "CRC check failed"
IOError: CRC check failed
还有什么方法可以使用 zlib 模块来执行此操作并忽略 gzip 标头?