39

有没有办法将字符串直接写入 tarfile?从http://docs.python.org/library/tarfile.html看起来只能添加已经写入文件系统的文件。

4

7 回答 7

37

我想说这是可能的,通过使用 TarInfo e TarFile.addfile 将 StringIO 作为文件对象传递。

非常粗糙,但有效

import tarfile
import StringIO

tar = tarfile.TarFile("test.tar","w")

string = StringIO.StringIO()
string.write("hello")
string.seek(0)
info = tarfile.TarInfo(name="foo")
info.size=len(string.buf)
tar.addfile(tarinfo=info, fileobj=string)

tar.close()
于 2009-04-11T21:48:26.313 回答
16

正如 Stefano 指出的那样,您可以使用TarFile.addfileand StringIO

import tarfile, StringIO

data = 'hello, world!'

tarinfo = tarfile.TarInfo('test.txt')
tarinfo.size = len(data)

tar = tarfile.open('test.tar', 'a')
tar.addfile(tarinfo, StringIO.StringIO(data))
tar.close()

您可能还想填写tarinfo(例如mtimeuname等)的其他字段。

于 2009-04-11T22:02:46.903 回答
11

我发现这正在寻找如何在 Django 中提供刚刚在内存中创建的 .tgz 存档,可能其他人会发现我的代码很有用:

import tarfile
from io import BytesIO


def serve_file(request):
    out = BytesIO()
    tar = tarfile.open(mode = "w:gz", fileobj = out)
    data = 'lala'.encode('utf-8')
    file = BytesIO(data)
    info = tarfile.TarInfo(name="1.txt")
    info.size = len(data)
    tar.addfile(tarinfo=info, fileobj=file)
    tar.close()

    response = HttpResponse(out.getvalue(), content_type='application/tgz')
    response['Content-Disposition'] = 'attachment; filename=myfile.tgz'
    return response
于 2016-11-03T00:37:03.837 回答
6

Python 3 中的解决方案使用io.BytesIO. 请务必设置TarInfo.size为字节的长度,而不是字符串的长度。

给定一个字符串,最简单的解决方案是调用.encode()它来获取字节。在当今时代,您可能需要 UTF-8,但如果收件人希望使用特定的编码,例如 ASCII(即没有多字节字符),那么请改用它。

import io
import tarfile

data = 'hello\n'.encode('utf8')
info = tarfile.TarInfo(name='foo.txt')
info.size = len(data)

with tarfile.TarFile('test.tar', 'w') as tar:
    tar.addfile(info, io.BytesIO(data))

如果您真的需要一个可写的字符串缓冲区,类似于@Stefano Borini 对于 Python 2 接受的答案,那么解决方案是使用io.TextIOWrapper底层io.BytesIO缓冲区。

import io
import tarfile

textIO = io.TextIOWrapper(io.BytesIO(), encoding='utf8')
textIO.write('hello\n')
bytesIO = textIO.detach()
info = tarfile.TarInfo(name='foo.txt')
info.size = bytesIO.tell()

with tarfile.TarFile('test.tar', 'w') as tar:
    bytesIO.seek(0)
    tar.addfile(info, bytesIO)
于 2018-10-09T15:26:25.107 回答
4

仅作记录:
StringIO 对象具有 .len 属性。
无需 seek(0) 并执行 len(foo.buf)
无需保留整个字符串以执行 len() 或上帝禁止,自己进行会计处理。

(也许在写 OP 的时候没有。)

于 2014-08-06T10:12:30.507 回答
3

就我而言,我想从现有的 tar 文件中读取数据,将一些数据附加到内容中,然后将其写入新文件。就像是:

for ti in tar_in:
    buf_in = tar.extractfile(ti)
    buf_out = io.BytesIO()
    size = buf_out.write(buf_in.read())
    size += buf_out.write(other data)
    buf_out.seek(0)
    ti.size = size
    tar_out.addfile(ti, fileobj=buf_out)

处理目录和链接需要额外的代码。

于 2013-08-03T10:21:11.760 回答
2

您必须使用 TarInfo 对象和 addfile 方法而不是通常的 add 方法:

from StringIO import StringIO
from tarfile import open, TarInfo

s = "Hello World!"
ti = TarInfo("test.txt")
ti.size = len(s)

tf = open("testtar.tar", "w")
tf.addfile(ti, StringIO(s))
于 2009-04-11T22:04:37.007 回答