我正在使用 Pandas 库进行遥感时间序列分析。最终我想通过使用块大小将我的 DataFrame 保存到 csv,但我遇到了一个小问题。我的代码生成了 6 个 NumPy 数组,我将它们转换为 Pandas 系列。这些系列中的每一个都包含很多项目
>>> prcpSeries.shape
(12626172,)
我想将系列添加到 Pandas DataFrame (df) 中,以便我可以将它们逐块保存到 csv 文件中。
d = {'prcp': pd.Series(prcpSeries),
'tmax': pd.Series(tmaxSeries),
'tmin': pd.Series(tminSeries),
'ndvi': pd.Series(ndviSeries),
'lstm': pd.Series(lstmSeries),
'evtm': pd.Series(evtmSeries)}
df = pd.DataFrame(d)
outFile ='F:/data/output/run1/_'+str(i)+'.out'
df.to_csv(outFile, header = False, chunksize = 1000)
d = None
df = None
但是我的代码卡在下一行给出内存错误
df = pd.DataFrame(d)
有什么建议么?是否可以逐块填充 Pandas DataFrame 块?