我正在遍历一个非常大的制表符分隔文件(包含数百万行)并根据该文件中某些字段的值配对它的不同行,例如
mydict = defaultdict()
for line in myfile:
# Group all lines that have the same field into a list
mydict[line.field].append(line)
由于“mydict”变得非常大,我想把它变成一个迭代器,这样我就不必把它全部保存在内存中。我怎样才能做到这一点,而不是填充字典,而是创建一个迭代器,我可以循环并获取所有这些具有相同字段值的行列表?
谢谢。