0

我有一个 Excel 文件作为源文件,我想从 Excel 文件中读取数据并使用 Databricks 转换 DataFrame 中的数据。我是 Scala 的新手。

val df = spark.read.format("com.crealytics.spark.excel")
.option("location", "/FileStore/tables/Airline.xlsx") 
.option("useHeader","true")
.option("treatEmptyValuesAsNulls", "false") 
.option("inferSchema","false")
.option("addColorColumns", "false") 
.load("/FileStore/tables/Airline.xlsx") 
4

1 回答 1

0

您可以使用可用的 Excel 插件:

libraryDependencies += "com.crealytics" %% "spark-excel" % "0.8.2"

按照https://github.com/crealytics/spark-excel中的示例构建您的数据框。

于 2019-05-07T09:39:19.033 回答