0

我正在使用带有 Scala 2.11 的 spark-core 版本 2.0.1。我有简单的代码来读取具有 \ 转义的 csv 文件。

val myDA = spark.read
      .option("quote",null)
    .schema(mySchema)
    .csv(filePath)

根据文档 \ 是 csv 阅读器的默认转义。但它不起作用。Spark 正在读取 \ 作为我数据的一部分。例如: csv 文件中的 City 列是north rocks\,au。我期望 city 列应该在代码中读取为northrocks,au。但是 spark 将其读取为northrocks\并将au移动到下一列。

我试过以下但没有奏效:

  • 明确定义的转义 .option("escape","\")
  • 将转义更改为 | 或:在文件和代码中
  • 我试过使用 spark-csv 库

任何人面临同样的问题?我错过了什么吗?

谢谢

4

1 回答 1

0

所以 escape 只适用于引号。如果您想转义,建议使用引号。

https://github.com/databricks/spark-csv/issues/390

于 2016-10-27T21:59:38.563 回答