我有一张如下表:
User:String Alias:String
JohnDoe John
JohnDoe JDoe
Roger Roger
我想将用户的所有别名分组到一个数组中,在一个看起来像这样的新表中:
User:String Alias:array<String>
JohnDoe [John, JDoe]
Roger [Roger]
我不知道如何用 HiveQL 做到这一点。我必须为此编写一个 UDF 吗?
谢谢 !
查看内置聚合函数 collect_set。
select
User,
collect_set(Alias) as Alias
from table
group by User;