0

PDI 在使用 Microsoft Excel Writer 编写 excel xlsx 文件方面效率低下。

如果手动转换数据,Pentaho 输出中转换后的 excel 数据文件似乎是其大小的三倍。这种低效率是预期的还是有解决方法的。

具有相同转换输出的 CSV 文件的大小要小得多。我配置错了吗?

4

1 回答 1

1

xlsx 文件的大小通常应小于 CSV,因为它们由压缩在 ZIP 文件中的 XML 数据组成。PentahoMicrosoft Excel Writer使用org.apache.poi.xssf.streaming.SXSSFWorkbookandorg.apache.poi.xssf.usermodel.XSSFWorkbook来编写 xlsx 文件,它们会创建压缩文件,所以这不应该是你的问题。

要检查文件,您可以使用 zip 实用程序检查,查看文件大小和压缩率,查看是否存在错误。您也可以尝试在 Excel 中打开文件并重新保存,看看是否会产生较小的尺寸,这可能表明效率低下。

于 2016-03-01T18:51:24.420 回答