PDI 在使用 Microsoft Excel Writer 编写 excel xlsx 文件方面效率低下。
如果手动转换数据,Pentaho 输出中转换后的 excel 数据文件似乎是其大小的三倍。这种低效率是预期的还是有解决方法的。
具有相同转换输出的 CSV 文件的大小要小得多。我配置错了吗?
如果手动转换数据,Pentaho 输出中转换后的 excel 数据文件似乎是其大小的三倍。这种低效率是预期的还是有解决方法的。
具有相同转换输出的 CSV 文件的大小要小得多。我配置错了吗?
xlsx 文件的大小通常应小于 CSV,因为它们由压缩在 ZIP 文件中的 XML 数据组成。PentahoMicrosoft Excel Writer
使用org.apache.poi.xssf.streaming.SXSSFWorkbook
andorg.apache.poi.xssf.usermodel.XSSFWorkbook
来编写 xlsx 文件,它们会创建压缩文件,所以这不应该是你的问题。
要检查文件,您可以使用 zip 实用程序检查,查看文件大小和压缩率,查看是否存在错误。您也可以尝试在 Excel 中打开文件并重新保存,看看是否会产生较小的尺寸,这可能表明效率低下。