我正在尝试以 orc 格式保存我的 RDD。
val data: RDD[MyObject] = createMyData()
val sqlContext = new SQLContext(sc)
import sqlContext.implicits._
data.toDF.write.format("orc").save(outputPath)
它编译得很好,但它不起作用。我得到以下异常:
ERROR ApplicationMaster: User class threw exception: java.lang.AssertionError: assertion failed: The ORC data source can only be used with HiveContext.
java.lang.AssertionError: assertion failed: The ORC data source can only be used with HiveContext.
我想避免使用 hive 来执行此操作,因为我的数据在 hdfs 中,并且与任何 hive 表都不相关。有什么解决方法吗?它适用于 Parquet 格式。提前致谢。