我正在使用查询从 MYSQL 中获取数据,如下所示:
var df = spark.read.format("jdbc")
.option("url", "jdbc:mysql://10.0.0.192:3306/retail_db")
.option("driver" ,"com.mysql.jdbc.Driver")
.option("user", "retail_dba")
.option("password", "cloudera")
.option("dbtable", "orders")
.option("partitionColumn", "order_id")
.option("lowerBound", "1")
.option("upperBound", "68883")
.option("numPartitions", "4")
.load()
问题是,我可以在我指定的位置使用伪列(如ROWNUM
在 Oracle 或RRN(employeeno)
DB2 中)吗?option
partitionColumn
如果不是,我们可以指定一个不是主键的分区列吗?