0

无法处理 apache spark 中日期列的空值。我尝试将 null 替换为空字符串以及 null 值。

我得到的错误是 java.text.ParseException: Unparseable date: ""

我正在使用 csv-spark,databricks:spark-redshift_2.11 2.0.1

代码

var originalDataFrame = sqlContext.load( "com.databricks.spark.csv", schema = sourceSchema, Map("path" -> filePath, "header" -> "false", "codec"->"org.apache.hadoop.io.compress.GzipCodec", "delimiter"->"|", "dateFormat" -> dateFormat, "nullValue"->"" ))

提前致谢。

4

0 回答 0