0

这可能是一个非常简单的问题。我想将数据框的所有行转置为列。我想转换这个df,如下所示输出DF。spark中有什么方法可以实现这一目标?

注意:我在输入 DF 中有单列

import sparkSession.sqlContext.implicits._
val df = Seq(("row1"), ("row2"), ("row3"), ("row4"), ("row5")).toDF("COLUMN_NAME")
df.show(false)

    Input DF:
    +-----------+
    |COLUMN_NAME|
    +-----------+
    |row1       |
    |row2       |
    |row3       |
    |row4       |
    |row5       |
    +-----------+

    Output DF
    +----+----+----+----+----+
    |row1|row2|row3|row4|row5|
    +----+----+----+----+----+
  
4

1 回答 1

0

这对你有帮助吗?

df.withColumn("group",monotonicallyIncreasingId  ).groupBy("group").pivot("COLUMN_NAME").agg(first("COLUMN_NAME")).show
于 2020-06-20T13:15:47.907 回答