我已将 Spark 数据帧保存到云对象存储到 Watson Studio 项目的存储桶中:
staging
.write
.mode("overwrite")
.option("header", "true")
.csv(cos.url('all.csv', 'myproject-bucket'))
我会将生成的文件夹显示在项目资产中。
最初,我尝试使用 project-lib,但从文档看来,您必须拥有一个类似对象的文件,这意味着将所有数据带回驱动程序节点,如果这样做,我的内存就会用完。