0

我有很多 csv 文件包含在不同的 7z 文件中。我想在那些 7z 文件中找到特定的 csv 文件,并将它们解压缩后保存在不同的目录中。我努力了

import os
import py7zlib

tree = r'Where_the_7zfiles_are_stored'
dst = r'Where_I_want_to_store_the_csvfiles'

for dirpath, dirname, filename in os.walk(tree):
    for myfile in filename:
        if myfile.endswith('2008-01-01_2008-04-30_1.7z'):
            myZip = py7zlib.Archive7z(open(os.path.join(dirpath,myfile), 'rb'))
            csvInZipFile = zip(myZip.filenames,myZip.files)
            for myCsvFileName, myCsvFile in csvInZipFile:
                if '2008-01' in myCsvFileName:
                    with open(os.path.join(dst,myCsvFileName),'wb') as outfile:
                        outfile.write(myCsvFile.read())

但我收到以下错误

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Users\'\Anaconda3\lib\site-packages\spyderlib\widgets\externalshell\sitecustomize.py", line 682, in runfile
execfile(filename, namespace)
  File "C:\Users\'\Anaconda3\lib\site-packages\spyderlib\widgets\externalshell\sitecustomize.py", line 85, in execfile
    exec(compile(open(filename, 'rb').read(), filename, 'exec'), namespace)
  File "C:/Users//'/Documents/Example/unzipfiles.py", line 23, in <module>
outfile.write(myCsvFile.read())
  File "C:\Users\'\Anaconda3\lib\site-packages\py7zlib.py", line 576, in read
    data = getattr(self, decoder)(coder, data)
  File "C:\Users\'\Anaconda3\lib\site-packages\py7zlib.py", line 634, in _read_lzma
return self._read_from_decompressor(coder, dec, input, checkremaining=True, with_cache=True)
  File "C:\Users\'\Anaconda3\lib\site-packages\py7zlib.py", line 611, in _read_from_decompressor
    tmp = decompressor.decompress(data)
ValueError: data error during decompression

奇怪的是,该方法似乎适用于前两个 csv 文件。我不知道如何找到问题的根源。至少 csv 文件中的数据似乎没有什么不同。使用 IZArc 手动解压缩不同的 csv 文件没有问题。(问题出现在 python 2.7 和 3.4 中)。

我也尝试过使用 lzma 模块,但在这里我无法弄清楚如何检索 7z 文件中包含的不同 csv 文件。

4

0 回答 0