4

str在 python 中添加到 tar arhive 时遇到问题。在 python 2 中,我使用了这样的方法:

fname = "archive_name"
params_src = "some arbitrarty string to be added to the archive"

params_sio = io.StringIO(params_src)
archive = tarfile.open(fname+".tgz", "w:gz")
tarinfo = tarfile.TarInfo(name="params")
tarinfo.size = len(params_src)
archive.addfile(tarinfo, params_sio)

它与这里的内容基本相同。它运作良好。但是,转到 python 3 它坏了并导致以下错误:

  File "./translate_report.py", line 67, in <module>
    main()
  File "./translate_report.py", line 48, in main
    archive.addfile(tarinfo, params_sio)
  File "/usr/lib/python3.2/tarfile.py", line 2111, in addfile
    copyfileobj(fileobj, self.fileobj, tarinfo.size)
  File "/usr/lib/python3.2/tarfile.py", line 276, in copyfileobj
    dst.write(buf)
  File "/usr/lib/python3.2/gzip.py", line 317, in write
    self.crc = zlib.crc32(data, self.crc) & 0xffffffff
  TypeError: 'str' does not support the buffer interface

老实说,我很难理解它的来源,因为我没有将任何内容反馈strtarfile模块回到我构造StringIO对象的位置。我知道和的含义StringIOstr字节等从 python 2 到 3 发生了一些变化,但我没有看到错误,也无法想出更好的逻辑来解决这个任务。

我精确地创建StringIO对象以围绕要添加到存档的字符串提供缓冲区方法。然而让我感到震惊的是,有些str人没有提供它。最重要的是,围绕似乎负责校验和计算的行引发了异常。

有人可以解释一下我的误解,或者至少举一个例子,如何在str不在文件系统上创建中间文件的情况下向 tar 存档添加一个简单的文件。

4

1 回答 1

4

写入文件时,您需要将 unicode 数据显式编码为字节;StringIO对象不会为您执行此操作,它是一个文本内存文件。改为使用io.BytesIO()并编码:

params_sio = io.BytesIO(params_src.encode('utf8'))

当然,将您的编码调整为您的数据。

于 2012-12-21T11:10:12.023 回答