我正在使用带有 Merge 的 Delta Lake 0.4.0,例如:
target.alias("t")
.merge(
src.as("s"),
"s.id = t.id
)
.whenMatched().updateAll()
.whenNotMatched().insertAll()
.execute()
src 从包含数千个文件的文件夹中读取。合并结果也会生成许多小文件。有没有办法控制合并结果中的文件号,例如重新分区(1)或合并(1)的效果?
谢谢