0

这是我的代码:

val df=hiveContext.write.format("orc").options("orc.compression","SNAPPY").save(
"xyz")

但文件保存为 ZLIB。

4

1 回答 1

0

您可以尝试将额外的配置“spark.io.compression.codec=snappy”添加到 spark-shell / spark-submit:

spark-shell --conf spark.io.compression.codec=snappy #rest of your command..

此外,要写入 ORC 格式(假设您使用的是 Spark >= 1.5),您可以使用:

myDf.orc("/some/path")

"orc" 方法与执行 '.format("orc").save("/some/path")' 完全一样。

于 2015-11-02T19:47:59.460 回答