我正在使用bz2.BZ2Decompressor
该类顺序解压缩 bz2 压缩数据流。我的流可能包含截断的压缩数据。我需要能够区分解压缩完整文件和仅解压缩部分文件的情况。有什么办法可以确定吗?
更详细地说,我提供给解压缩函数的数据流可能是也可能不是完整的 bz2 压缩文件。它可能会被截断。当我使用这个函数时,它会返回给我它能够使用数据解压缩的任何数量。它没有告诉我是否已到达流的末尾。我如何确定相同?只有在找到流结束后EOFError
还有其他数据时才会引发。所以这对我没有帮助。
decompress()
您可以通过将一些额外的“垃圾”数据传递给解压缩器的方法来检测您的数据流是否完整。如果流已完成,它将引发EOFError
. 如果流仍在继续,它可能不会引发异常,因为解压缩器将假定垃圾是截断流的一部分。
这是一些示例代码:
import bz2
def decompress(stream):
decompressor = bz2.BZ2Decompressor()
# this generator decompresses the data from the iterable stream
results = "".join(decompressor.decompress(data) for data in stream)
# now we test to see if it was a complete BZ2 stream
try:
decompressor.decompress("\0") # try adding a "junk" null character
except EOFError: # the stream was complete!
return results
except IOError: # the junk may cause an IOError if it hits a BZ2 header
pass
# if we reach this point here, the stream was incomplete
print "Incomplete stream!"
return None # you may or may not want to throw away the partial results