我需要一种方法将包含特定列数据的列表放入 excel 但出现内存错误如何使用 dask 完成此任务,我的系统只有 8 GB 内存。
我正在从一个巨大的 .dat 文件(包含文本,就像带有行和列的表一样)创建一个 excel 文件,大约(2 GB 或更多)从 .dat 文件中提取几列我知道行号(从结构文件)我需要提取的列并创建了一个列表来列出这些数据。
我将从结构化文件中提取单元格值以获取用作列的行号
df=pd.DataFrame()
with open(r"C:/new.dat" ,encoding ="utf-16") as f:
content = f.readlines()
f.close()
C = []
c=[]
for k in range(1,sheet.nrows):
C = []
C.append(sheet.cell_value(k,0))
for line in content:
C.append(line[int(sheet.cell_value(k,1))-1:int(sheet.cell_value(k, 2))])
c.append(C)
d=iter(c)
#getting memory error from the code below
row = 0
workbook = xlsxwriter.Workbook('table.xlsx')
worksheet = workbook.add_worksheet()
for col, data in enumerate(d):
worksheet.write_column(row, col, data)
workbook.close()
我想获得没有内存错误的excel文件。