14

我目前正在调试一个猪脚本。我想直接在 Pig 文件中定义一个元组(而不是基本的“加载”函数)。

有没有办法做到这一点?

我正在寻找类似的东西:

A= ('name#bob'','age#29';'name#paul','age#12')

转储将返回:

('bob',29)
('paul',12)
4

2 回答 2

4

事实上,按照目前的情况在猪身上做这件事是不可能的。如果您只想调试在 hadoop 中创建一个文件并加载它。将您想要的数据写入文件(如果可能的话,您将手动创建的任何内容)并上传。然后使用 pig 加载它。

于 2013-11-07T21:29:10.537 回答
1

以下(肮脏的)技巧可以完成这项工作: - 创建一个包含一个空行的文件并将其存储到您的 HDFS。- 加载它: Line = load /user/toto/onelinefile USING .. - 创建自己的数据:foreach 行生成 'bob' 作为名称,22 作为年龄;

于 2014-04-19T00:03:56.217 回答