我有一个非常大的 zip 文件,它被分成多个部分作为拆分档案,档案中有一个文件。我没有足够的资源将这些档案组合在一起或提取它们(原始文本文件将近 1TB)。
我想逐行解析文本文件,理想情况下使用如下内容:
import zipfile
for zipfilename in filenames:
with zipfile.ZipFile(zipfilename) as z:
with z.open(...) as f:
for line in f:
print line
这可能吗?如果是这样,我该如何阅读文本文件:
- 不使用太多内存(将整个文件加载到内存中显然是不可能的)
- 无需提取任何 zip 文件
- (理想情况下)不合并 zip 文件
预先感谢您的帮助。