给定一个包含路径和其他一些列的输入文件:
\aa\bb\cc ...
\aa\bb\cc\dd\ee ...
\xx\yy\zz ...
我正在寻找 HiveQL 中的方法来将路径分解为一个不同的列表,包括所有祖先路径。对于上面的示例,结果应该是:
\aa
\aa\bb
\aa\bb\cc
\aa\bb\cc\dd
\aa\bb\cc\dd\ee
\xx
\xx\yy
\xx\yy\zz
有没有办法在 Hive 中做到这一点而不求助于自定义 Java UDF?
如果没有,Pig 怎么样?