有没有办法展平任意嵌套的 Spark Dataframe?我看到的大部分工作都是为特定模式编写的,我希望能够用不同的嵌套类型(例如 StructType、ArrayType、MapType 等)通用地展平 Dataframe。
假设我有一个类似的架构:
StructType(List(StructField(field1,...), StructField(field2,...), ArrayType(StructType(List(StructField(nested_field1,...), StructField(nested_field2,...)),nested_array,...)))
希望将其调整为具有以下结构的平面表:
field1
field2
nested_array.nested_field1
nested_array.nested_field2
仅供参考,寻找有关 Pyspark 的建议,但也赞赏其他风格的 Spark。