我想用 Apache POI 阅读一个大的 Excel 2007 文件。快速入门指南指出File
应该使用 a 来节省内存。
打开工作簿(.xls HSSFWorkbook 或 .xlsx XSSFWorkbook)时,可以从文件或 InputStream 加载工作簿。使用 File 对象可以降低内存消耗,而 InputStream 需要更多内存,因为它必须缓冲整个文件。
因此,我大致这样写:
opcPackage = OPCPackage.open(file);
XSSFWorkbook workbook = new XSSFWorkbook(opcPackage);
XSSFSheet sheet = workbook.getSheetAt(0);
rows = sheet.rowIterator();
if (rows.hasNext()) {
Row row = rows.next();
System.out.println(row.getCell(1).getStringCellValue());
}
但是,这会导致工作java.lang.OutOfMemoryError: Java heap space
表的行数超过大约 10000 行。
我希望迭代只延迟加载那些要读取的行,比如流。
如何解决大型 Excel 文件的内存问题?我可以用 Apache POI 懒惰地阅读吗?