我在 DataBricks 上有 spark 数据框,其列的字符长度 > 10,000。
我需要将其插入 Azure 数据仓库 (ADW) 表,但如果列字符长度超过 4,000,则会出现错误。
错误:填充记录读取器缓冲区时遇到意外错误:HadoopSqlException:字符串或二进制数据将被截断。
df.write.format("com.databricks.spark.sqldw") \
.option("url", sqlDwUrl) \
.option("forwardSparkAzureStorageCredentials", "true") \
.option("dbtable", writeTableName) \
.option("tempDir", tempDir) \
.mode("append") \
.option("maxStrLength",4000)\
.save()
我需要做什么才能插入字符长度 > 10k 或 20k 的列。