0

我正在尝试使用 HiveQL 在 Amazon EMR 上运行查询。表结构如下:

parentId INT,
 数组:结构:childId:INT,类别:INT  

我希望能够通过 parentId 和 childId 的组合进行分组,我该怎么做?我是否需要将表导出到另一个表,以便每个 parentId 和 childId 成为自己的行?或者,还有更好的方法?

提前致谢!

4

1 回答 1

0
Figured this out: 

<pre>
    SELECT parentId, array_items.childId , array_items.category 
    FROM table LATERAL VIEW explode(array) exploded_table as array_items;
</pre>

does the trick. Thanks @libjack
于 2013-07-31T23:38:09.547 回答