我使用 Spark 2.2.0
我正在读取一个 csv 文件,如下所示:
val dataFrame = spark.read.option("inferSchema", "true")
.option("header", true)
.option("dateFormat", "yyyyMMdd")
.csv(pathToCSVFile)
此文件中有一个日期列,并且所有记录的值都等于20171001
该特定列的值。
问题是 spark 推断该列的类型是integer
而不是date
. 当我删除该"inferSchema"
选项时,该列的类型是string
.
此文件中没有null
值,也没有任何格式错误的行。
这个问题的原因/解决方案是什么?