我正在尝试使用 JDBC 从数据库表中读取一些内容:
val df = spark.read.jdbc("<database url>", "<some table name>", <some DbProperties>)
然后将其写入另一个数据库:
df.write.mode(SaveMode.Append).jdbc("<other database url>", "<same table name>", <some DbProperties>)
- 如果我们没有在 Db 属性中指定选项, Spark 用于将表从数据库读取到
numPartitions的默认值是多少?numPartitionsdf - 如果我想将上面的
df内容写入另一个数据库的另一个表中,如果我仍然不指定numPartitions,写入数据库时是否会创建并行连接? - 假设在阅读时我给出
numPartitions了 8,在将df其写入目标数据库时,如果numPartitions = 8没有我在写入时明确指定它,它仍然有效吗?