6

我在内存受限的环境中工作,我需要制作 SQL 转储存档。如果我使用 python 的内置tarfile模块,是在内存中保存的“.tar”文件还是在创建时写入磁盘?

例如,在下面的代码中,如果huge_file.sql是 2GB,tar变量会占用 2GB 的内存吗?

import tarfile

tar = tarfile.open("my_archive.tar.gz")), "w|gz")
tar.add('huge_file.sql')
tar.close()
4

1 回答 1

5

不,它没有将其加载到内存中。您可以阅读tarfile 的源代码以查看它正在使用copyfileobj,它使用固定大小的缓冲区从文件复制到 tarball:

def copyfileobj(src, dst, length=None):
    """Copy length bytes from fileobj src to fileobj dst.
       If length is None, copy the entire content.
    """
    if length == 0:
        return
    if length is None:
        shutil.copyfileobj(src, dst)
        return

    BUFSIZE = 16 * 1024
    blocks, remainder = divmod(length, BUFSIZE)
    for b in xrange(blocks):
        buf = src.read(BUFSIZE)
        if len(buf) < BUFSIZE:
            raise IOError("end of file reached")
        dst.write(buf)

    if remainder != 0:
        buf = src.read(remainder)
        if len(buf) < remainder:
            raise IOError("end of file reached")
        dst.write(buf)
    return
于 2011-03-10T19:31:08.187 回答