我现在正在 EdX 上介绍 Spark 课程。是否有可能在我的计算机上保存来自 Databricks 的数据帧。
我在问这个问题,因为本课程提供的 Databricks 笔记本在课程结束后可能无法使用。
在 notebook 中使用命令导入数据:
log_file_path = 'dbfs:/' + os.path.join('databricks-datasets', 'cs100', 'lab2', 'data-001', 'apache.access.log.PROJECT')
我找到了这个解决方案,但它不起作用:
df.select('year','model').write.format('com.databricks.spark.csv').save('newcars.csv')