Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个猪输出文件,其原始数据看起来像这样(2 个字段):
(45578713,45578728,) 8139
第一个字段是以前猪工作的组字段(我无法更改)。
现在我需要阅读这篇文章,我想将第一个字段 - (45578713,45578728,) - 分解为如下的单个数字(总共 3 个字段)
45578713 45578728 8139
我怎样才能做到这一点?我尝试使用 Pig 流,但我觉得我必须可以直接从 Pig 做一些事情。
这应该可以帮助你。
m = FOREACH g GENERATE FLATTEN(group), number;
看看FLATTEN运营商。
FLATTEN