让我们考虑一个大文件(~100MB)。让我们考虑该文件是基于行的(一个文本文件,行相对较短~80 个字符)。如果我使用内置open()
/file()
文件将以惰性方式加载。IE 如果我aFile.readline()
只做一个文件的一部分将驻留在内存中。urllib.urlopen() 是否做类似的事情(使用磁盘上的缓存)?
urllib.urlopen().readline()
和之间的性能差异有多大file().readline()
?让我们考虑该文件位于本地主机上。一旦我打开它,urllib.urlopen()
然后用file()
. 当我用 循环文件时,性能/内存消耗的差异有多大readline()
?
处理通过打开的文件的最佳方法是什么urllib.urlopen()
?逐行处理是否更快?或者我应该将一堆行(〜50)加载到一个列表中然后处理该列表?