问题标签 [spark-excel]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

36 问题

0 投票

2 回答

3757 浏览

excel - 如何在 Scala/Spark 中创建包含来自多个 DataFrame 的多个工作表的 excel 文件？

在Scala/Spark应用程序中，我创建了两个不同的 DataFrame。我的任务是为每个 DataFrame 创建一个带有两张工作表的 excel 文件。

我决定使用spark-excel库，但我有点困惑。据我了解，未来的excel文件是保存在hdfs文件系统中的吧？我需要在.save()方法中设置未来excel文件的路径，对吗？另外我不明白应该dataAddress选择什么格式？

excel scala dataframe apache-spark spark-excel

2019-08-29T03:13:48.313

0 投票

1 回答

574 浏览

excel - scala.MatchError 尝试通过 com.crealytics.spark.excel 读取 excel 文件

我正在尝试通过 com.crealytics.spark.excel 读取 excel 文件。但是我在尝试运行我的代码时遇到以下错误：

这是我的代码：

excel apache-spark spark-excel

2019-09-16T19:05:33.187

0 投票

0 回答

590 浏览

excel - 有没有办法通过 Scala/Spark 应用程序中的 Apache POI 设置 Excel 文件的样式？

在我的 Scala 应用程序中，我使用 Spark 插件 ( spark-excel ) 通过 Apache POI 创建和编写带有多个新工作表的 Excel 文件。

问题：有什么办法可以改变 Excel 文件的样式？例如我想改变标题的颜色，也改变列的宽度。你有什么建议？

excel scala apache-spark apache-poi spark-excel

2019-09-17T19:00:33.343

0 投票

1 回答

188 浏览

excel - 在 Spark 错误中读取 Excel：ZipArchiveInputStream 类的 InputStream 未实现 InputStreamStatistics

我正在尝试通过 spark 从 COS 读取 excel 文件，就像这样

在这段代码中，我首先创建一个空数据框，然后读取所有 excel 文件（通过迭代文件路径）并通过联合操作合并数据。

它抛出这样的错误

sparkExcel 版本为 0.10.2

excel apache-spark spark-excel

2019-10-03T11:05:24.383

0 投票

1 回答

591 浏览

apache-spark - 如何使用 apache spark scala 读取 XLSX 的整个目录？

我必须读取 xlsx 文件的整个目录，并且需要使用 Scala 使用 Apache Spark 加载所有目录。

实际上我正在使用这个依赖项： "com.crealytics" %% "spark-excel" % "0.12.3"，我不知道如何加载所有内容。

apache-spark apache-spark-sql spark-excel

2019-10-18T22:42:44.863

0 投票

0 回答

527 浏览

java - 如何使用 Apache Spark 读取来自公式的 excel 文件列数据

我正在尝试读取 spark 中的一个 excel 文件。我正在crealytics为此使用库。

但是我的代码失败了，因为其中一列正在引用表格以通过VLOOKUP公式填充其值。

我一直在尝试使用“crealytics”库，但没有运气。

java.lang.RuntimeException：VLOOKUP 的未知单元格类型 2。

java scala apache-spark spark-excel

2019-11-05T13:44:12.783

0 投票

1 回答

253 浏览

scala - 如何以orc格式在已经创建的hive表中加载excel数据

我需要以 orc 格式在已经创建的配置单元表中加载数据。

即我需要从excel表中读取数据，创建数据框，然后将其加载到orc格式的hive表中。

scala apache-spark hadoop hive spark-excel

2020-01-17T15:02:59.077

0 投票

2 回答

17982 浏览

apache-spark - 在 pyspark 中读取 Excel (.xlsx) 文件

我正在尝试从 PySpark 中的本地路径读取 .xlsx 文件。

我写了下面的代码：

错误：

TypeError：“DataFrameReader”对象不可调用

apache-spark pyspark spark-excel

2020-01-22T07:48:26.057

0 投票

1 回答

581 浏览

java - java - 在使用java中的crealytics/spark-excel将多个org.apache.spark.sql.Dataset写入.xls文件时如何提及单个工作表名称？

我正在尝试将不同的 Java 数据集写入一个 excel 文件，该文件将使用 crealytics/spark-excel 库在其中包含多个工作表。

如何为这些单独的 Excel 工作表提供名称？

这是我想做的事情：

java apache-spark dataset rdd spark-excel

2020-03-03T04:51:20.643

0 投票

2 回答

3260 浏览

scala - 使用 apache spark 读取 excel 文件

（新的 Apache 火花）

我尝试创建一个小型 Scala Spark 应用程序，它读取 excel 文件并将数据插入数据库，但由于库版本不同（我认为），我遇到了一些错误。

Maven配置是：

Main.scala

错误是：

仅当我尝试读取 excel 文件时才会发生这种情况，因为我使用 spark-excel 库。CSV 或 tsv 工作正常。

scala apache-spark apache-spark-sql spark-excel

2020-07-08T09:16:35.993

1 2 3 4 5 6 7 8 9 10