这就是我正在做的事情:
reader = csv.reader(file)
fields = ["row_id","second_field","third_field",...]
for index, row in enumerate(reader):
mapped_row = dict(zip(fields,row))
DataEntry.objects.get_or_create(row_id=mapped_row["row_id"], defaults={
second_field = mapped_row["second_field"],
third_field = mapped_row["third_field"],
...
})
内存爆炸的方式不成比例!
在超过 50000 行之后,系统已经使用了4GB,然后开始在 HDD 上进行交换,并且 Python 不会释放未使用的内存。
我尝试在每一行添加以下内容无济于事
del index
del row
del mapped_row
我正在使用 Python 2.7.5 和 Django 1.5。
知道发生了什么吗?