3

我的目标是学习 Pig,以增强我在机器学习/统计分析工作中的简历。目前我对所有细节的 Hadoop 细节并不真正感兴趣(尽管我很想稍后再学习它们——即使有说明,在我的机器上进行设置也非常困难,我更像是一个统计员而不是程序员)。是否有一些资源可以让我学习 Pig,并且可以轻松访问它进行实验,而无需从头开始学习 Hadoop?

4

2 回答 2

5

是的。安装 pig 然后在本地运行它。它可以在本地完成所有可以通过 hadoop 完成的事情(尽管在大多数情况下速度更慢)。

对于交互式外壳(咕噜声):

pig -x local

要在本地运行 pig 脚本:

pig -x local some_script.pig

关于如何使用 pig 的最佳文档在Apache上已经结束,而且他们也有一个非常好的教程

于 2013-05-15T03:17:32.073 回答
0

试一试Cloudera QuickStartVM,它包括一个现成的 Pig 环境。

于 2013-11-04T03:31:42.850 回答