我目前正在处理我的第一个 Python 项目,我需要解析一个 2GB 的文件。我发现如果我逐行进行,它会非常非常慢......但是缓冲方法,使用:
f = open(filename)
lines = 0
buf_size = 1024 * 1024
read_f = f.read
buf = read_f(buf_size)
while buf:
for line in buf:
#code for string search
print line
buf = read_f(buf_size)
这里的打印行不打印“行”,它每行一次只打印一个字符。所以我在查找子字符串时遇到问题...请帮助!