4

我想用 Apache POI 阅读一个大的 Excel 2007 文件。快速入门指南指出File应该使用 a 来节省内存。

打开工作簿(.xls HSSFWorkbook 或 .xlsx XSSFWorkbook)时,可以从文件或 InputStream 加载工作簿。使用 File 对象可以降低内存消耗,而 InputStream 需要更多内存,因为它必须缓冲整个文件。

因此,我大致这样写:

opcPackage = OPCPackage.open(file);
XSSFWorkbook workbook = new XSSFWorkbook(opcPackage);
XSSFSheet sheet = workbook.getSheetAt(0);
rows = sheet.rowIterator();
if (rows.hasNext()) {
Row row = rows.next();
    System.out.println(row.getCell(1).getStringCellValue());
}

但是,这会导致工作java.lang.OutOfMemoryError: Java heap space表的行数超过大约 10000 行。

我希望迭代只延迟加载那些要读取的行,比如流。

如何解决大型 Excel 文件的内存问题?我可以用 Apache POI 懒惰地阅读吗?

4

1 回答 1

2

POI 提供了一个应该处理延迟加载的事件模型 API。有关 eventmodel其他流选项的更多详细信息,请参见POI 文档页面。

于 2013-06-12T13:33:33.373 回答