0

我正在使用bz2.BZ2Decompressor该类顺序解压缩 bz2 压缩数据流。我的流可能包含截断的压缩数据。我需要能够区分解压缩完整文件和仅解压缩部分文件的情况。有什么办法可以确定吗?

更详细地说,我提供给解压缩函数的数据流可能是也可能不是完整的 bz2 压缩文件。它可能会被截断。当我使用这个函数时,它会返回给我它能够使用数据解压缩的任何数量。它没有告诉我是否已到达流的末尾。我如何确定相同?只有在找到流结束EOFError还有其他数据时才会引发。所以这对我没有帮助。

4

1 回答 1

1

decompress()您可以通过将一些额外的“垃圾”数据传递给解压缩器的方法来检测您的数据流是否完整。如果流已完成,它将引发EOFError. 如果流仍在继续,它可能不会引发异常,因为解压缩器将假定垃圾是截断流的一部分。

这是一些示例代码:

import bz2

def decompress(stream):
    decompressor = bz2.BZ2Decompressor()

    # this generator decompresses the data from the iterable stream
    results = "".join(decompressor.decompress(data) for data in stream)

    # now we test to see if it was a complete BZ2 stream
    try:
        decompressor.decompress("\0") # try adding a "junk" null character
    except EOFError: # the stream was complete!
        return results
    except IOError: # the junk may cause an IOError if it hits a BZ2 header
        pass

    # if we reach this point here, the stream was incomplete
    print "Incomplete stream!"
    return None # you may or may not want to throw away the partial results
于 2012-07-05T05:25:24.397 回答