我有一个数据集需要定期导入到我的数据湖中,替换当前数据集在我生成数据框后,我目前正在执行:
df.write.format("delta").save("dbfs:/mnt/defaultDatalake/datasets/datasources")
但是,如果我再次运行该作业,我会收到以下错误:
AnalysisException: dbfs:/mnt/defaultDatalake/datasets/insights/datasources already exists.;
虽然我知道我以前可以做dbutils.fs.rm
,但我宁愿只是“替换”那里的数据有没有办法实现这一点?