0

给定一个包含路径和其他一些列的输入文件:

\aa\bb\cc         ... 
\aa\bb\cc\dd\ee   ...
\xx\yy\zz         ...

我正在寻找 HiveQL 中的方法来将路径分解为一个不同的列表,包括所有祖先路径。对于上面的示例,结果应该是:

\aa
\aa\bb
\aa\bb\cc
\aa\bb\cc\dd
\aa\bb\cc\dd\ee
\xx
\xx\yy
\xx\yy\zz

有没有办法在 Hive 中做到这一点而不求助于自定义 Java UDF?

如果没有,Pig 怎么样?

4

1 回答 1

0

我认为这更像是一种 mapreduce 问题,而不是数据库问题。它似乎很好地使用了 java 字符串操作和循环。

于 2012-12-09T01:55:16.830 回答