我在内存受限的环境中工作,我需要制作 SQL 转储存档。如果我使用 python 的内置tarfile
模块,是在内存中保存的“.tar”文件还是在创建时写入磁盘?
例如,在下面的代码中,如果huge_file.sql
是 2GB,tar
变量会占用 2GB 的内存吗?
import tarfile
tar = tarfile.open("my_archive.tar.gz")), "w|gz")
tar.add('huge_file.sql')
tar.close()
不,它没有将其加载到内存中。您可以阅读tarfile 的源代码以查看它正在使用copyfileobj
,它使用固定大小的缓冲区从文件复制到 tarball:
def copyfileobj(src, dst, length=None):
"""Copy length bytes from fileobj src to fileobj dst.
If length is None, copy the entire content.
"""
if length == 0:
return
if length is None:
shutil.copyfileobj(src, dst)
return
BUFSIZE = 16 * 1024
blocks, remainder = divmod(length, BUFSIZE)
for b in xrange(blocks):
buf = src.read(BUFSIZE)
if len(buf) < BUFSIZE:
raise IOError("end of file reached")
dst.write(buf)
if remainder != 0:
buf = src.read(remainder)
if len(buf) < remainder:
raise IOError("end of file reached")
dst.write(buf)
return