如果我想在 Spark DataSet列中存储代数数据类型 (ADT)(即 Scala 密封特征层次结构),最好的编码策略是什么?
例如,如果我有一个叶类型存储不同类型数据的 ADT:
sealed trait Occupation
case object SoftwareEngineer extends Occupation
case class Wizard(level: Int) extends Occupation
case class Other(description: String) extends Occupation
构建一个的最佳方法是什么:
org.apache.spark.sql.DataSet[Occupation]