我的基本需求是解析一个非常大的 xlsx 文件(100MB,150 万行和 10-15 列)。
我现在知道我最好的机会是处理底层 XML 文件,因为解析 xml 文件的内存占用比解析 xlsx 低得多(如果我只是尝试直接解析 xlsx 文件,我无法避免内存不足错误)。
到目前为止,我使用的是 SAX 解析器,它对于较小的文件运行良好,但在 60MB 左右它失败并抛出内存错误。我想知道 stax 解析器或 vdt-xml 在我的情况下是否更好?或者就此而言,任何其他 xml 解析方法来处理大文件?