问题标签 [apache-spark-encoders]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

51 问题

0 投票

3 回答

22048 浏览

scala - 为什么使用案例类对 JSON 进行编码时出现错误“无法找到存储在数据集中的类型的编码器”？

我写过火花工作：

在 IDE 中，当我运行 main 函数时，出现 2 个错误：

但在 Spark Shell 中，我可以运行此作业而不会出现任何错误。问题是什么？

2016-01-11T06:46:13.547

0 投票

9 回答

86372 浏览

scala - 如何在数据集中存储自定义对象？

根据介绍 Spark 数据集：

由于我们对 Spark 2.0 的期待，我们计划对 Datasets 进行一些激动人心的改进，特别是： ... 自定义编码器——虽然我们目前为多种类型自动生成编码器，但我们希望为自定义对象开放一个 API。

并尝试存储自定义类型Dataset导致以下错误，例如：

找不到存储在数据集中的类型的编码器。通过导入 sqlContext.implicits 支持原始类型（Int、String 等）和产品类型（案例类）。未来版本中将添加对序列化其他类型的支持

或者：

Java.lang.UnsupportedOperationException：没有找到用于 .... 的编码器

是否有任何现有的解决方法？

请注意，此问题仅作为社区 Wiki 答案的入口点存在。随时更新/改进问题和答案。

scala apache-spark apache-spark-dataset apache-spark-encoders

2016-04-15T13:11:07.843

0 投票

3 回答

22619 浏览

scala - 如何在 Spark 2.X 数据集中创建自定义编码器？

Spark 数据集从 Row's 转移到EncoderPojo's/primitives 的's。Catalyst引擎使用ExpressionEncoder转换 SQL 表达式中的列。但是，似乎没有其他子类Encoder可用作我们自己的实现的模板。

下面是一个在 Spark 1.X / DataFrames 中没有在新机制下编译的代码示例：

}

我们得到一个编译器错误

那么，不知何故/某处应该有办法

定义/实现我们的自定义编码器
DataFrame在（现在是类型的 Dataset Row）上执行映射时应用它
注册编码器以供其他自定义代码使用

我正在寻找成功执行这些步骤的代码。

scala apache-spark apache-spark-dataset apache-spark-encoders

2016-06-08T15:10:22.707

0 投票

3 回答

73068 浏览

scala - 为什么在创建自定义案例类的数据集时“无法找到存储在数据集中的类型的编码器”？

Spark 2.0（最终版）和 Scala 2.11.8。以下超级简单的代码会产生编译错误Error:(17, 45) Unable to find encoder for type stored in a Dataset. Primitive types (Int, String, etc) and Product types (case classes) are supported by importing spark.implicits._ Support for serializing other types will be added in future releases.

scala apache-spark apache-spark-dataset apache-spark-encoders

2016-07-29T18:04:35.560

0 投票

1 回答

6643 浏览