9

我有一张如下表:

User:String Alias:String
JohnDoe     John
JohnDoe     JDoe
Roger       Roger

我想将用户的所有别名分组到一个数组中,在一个看起来像这样的新表中:

User:String Alias:array<String>
JohnDoe     [John, JDoe]
Roger       [Roger]

我不知道如何用 HiveQL 做到这一点。我必须为此编写一个 UDF 吗?

谢谢 !

4

1 回答 1

16

查看内置聚合函数 collect_set

select 
    User, 
    collect_set(Alias) as Alias
from table
group by User;
于 2013-05-30T13:23:26.533 回答