2

我是 APACHE PIG 的初学者,以下是我有点困惑的地方

我正在尝试使用 pig -x local 在本地模式下运行 pig。

现在我正在尝试简单的代码

dividends = load 'NYSE_dividends' as (exchange, symbol, date, dividend);
grouping= group dividends by symbol;
avg= foreach grouped generate group, AVG(dividends.dividend);

store avg into 'average_dividend'.

在我的机器上形成了一个名为 average_dividend 的文件夹。

现在按照这本书,如果我想在本地模式下运行它,我必须给出以下语法

pig_path/bin/pig -x local average_dividend.pig

但是文件 average_dividend.pig 在哪里(就像它是在哪里形成的)?

4

1 回答 1

1

我假设您正在尝试运行Programming Pig的示例之一。首先找到您提取代码的目录。由于您在本地模式下工作,因此您必须将路径设置为,例如:,将输出目录(不应该存在)也设置在要保存结果的位置,例如: 。average_dividend.pigNYSE_dividendsload '/home/user/programmingpig-master/data/NYSE_dividends'store avg into '/home/user/output'

然后发出:

pig_path/bin/pig -x local -f average_dividend.pig
于 2013-03-16T13:39:54.637 回答