2

我正在尝试从文件中导出数据并使用 ExcelJS 将此数据添加到 Excel 文件中。

worksheet.addRows(freedomRawData.records);

“记录”是一个包含超过 165,000 个元素的数组。将数据写入excel文件时,出现错误-

致命错误:无效的数组长度分配失败 - JavaScript 堆内存不足

相同的脚本适用于“记录”长度为 115,000 个元素的数据。通过互联网,我找到了以下方法:

node --max-old-space-size=8192 <file_name>.js

这不起作用,我尝试使用 RAM 的最大容量(16384MB);这也没有帮助。我是 NodeJS 的新手,任何帮助将不胜感激。

4

1 回答 1

3

ExcelJS 有一个流式编写器接口:

async function writeExcel(rows_array){
  const workbook = new Excel.stream.xlsx.WorkbookWriter({ filename: 'stream.xlsx' })
  const worksheet = workbook.addWorksheet('data')
  for (const row of rows_array) {
    worksheet.addRow(row).commit()
  }
  await workbook.commit()
}

在这种情况下,由于 node/v8 垃圾收集器的工作方式,数据集仍然可能存在内存问题。垃圾收集需要点击事件循环才能真正清理“释放”的内存。如果您运行足够的同步代码,例如for循环,并且该循环每次迭代分配更多内存,则 GC 直到代码暂停后才能运行(即 final worbook.commit()。如果您仍然遇到 OOM 问题,那么您可以强制异步暂停以允许.commit()实际收集a 之后可以清理的行内存。

  for (const i in rows_array) {
    worksheet.addRow(rows_array[i]).commit()
    if (i % 10000 === 0) await Promise.resolve(true)
  }
于 2020-09-17T13:09:20.257 回答