我有一个看起来像这样的表:
当前数据帧/表:'original_table'
col_1 col_2 col_3
0 Non-Saved www.google.com 10
1 Non-Saved www.facebook.com 20
2 Non-Saved www.linkedin.com 20
3 Saved www.Quora.com 30
4 Saved www.gmail.com 40
我可以使用 SQL 查询派生如下表吗?
col_1 col_2 col_3
0 Non-Saved www.google.com 50
www.facebook.com
www.linkedin.com
1 Saved www.Quora.com 70
www.gmail.com
基本上我期望一个表具有来自 col_1 的 DISTINCT 值,来自 col_2 的所有对应值和来自 col_3 的对应值的 SUM(col_3) 在一行中。
我的查询:
sql("""SELECT col_1, group_concat(col_2) as col_2, SUM(col_3) as col_3
FROM original_table
GROUP BY col_1
""").show()
我尝试使用group_concat使用嵌入式 SQL 查询,但它给了我以下错误:
AnalysisException: u"Undefined function: 'GROUP_CONCAT'. This function
is neither a registered temporary function nor a permanent function
registered in the database 'default'.
任何人都可以帮我做一个简单的黑客吗?