+---------+------------------+
| Month|sum(buss_days)|
+---------+------------------+
| April| 83.93|
| August| 94.895|
| December| 53.47|
| February| 22.90|
| January| 97.45|
| July| 95.681|
| June| 23.371|
| March| 35.957|
| May| 4.24|
| November| 1.56|
| October| 1.00|
|September| 93.51|
+---------+------------------+
我想要这样的输出
+---------+------------------+ | 月|总和(avg_buss_days)| +---------+------------------+ | 一月| 97.45 二月| 22.90 三月| 35.957 四月| 83.93| | 五月| 4.24 六月| 23.371 七月| 95.681 八月| 94.895| | 九月| 93.51 十月| 11 月 1 日| 1.56 十二月| 53.47| +---------+------------------+
这就是我所做的 df.groupBy("Month[order(match(month$month, month.abb)), ]") 我得到了这个.....线程“main”org.apache中的异常。 spark.sql.AnalysisException:无法解析列名“Month[order(match(month$month, month.abb)), ]”。这里 Month 是数据框中的列名