4

我有一个包含数百列的 csv 文件,当我将文件加载到 Pig 中时,我不想像分配每一列

A = load 'path/to/file' as (a,b,c,d,e......)

因为我会在第二步过滤很多:

B = foreach A generate $0,$2,....;

但是在这里,我可以为 B 的每一列分配一个名称和类型吗?就像是

B = foreach A generate $0,$2,... AS (a:int,b:int,c:float)

我尝试了上面的代码,但它不起作用。

谢谢。

4

1 回答 1

4

您必须在每个逗号之间指定它们。

B = foreach A generate $0 as a, $2 as b,...

请注意,它只是假定它已经是类型。

于 2013-10-24T17:36:18.480 回答