2

我正在尝试运行嵌入在 python 中的 Pig 脚本。我已经在我自己的机器上运行了 pig-x local pigRunner.py 之类的脚本,但是当我把它移到亚马逊的 EC2 上时,我得到了一个令人惊讶的错误:

File "pigRunner.py", line 3 in <module>
  from org.apache.pig.scripting import *
ImportError: No module named pig

[1]+ Exit 6 pig -x mapreduce pigRunner.py

有没有其他人在亚马逊上运行 Python 脚本有困难?为了让他们处理,我应该做些什么特别的事情吗?

感谢您的任何帮助,您可以提供。

4

1 回答 1

0

我遇到了同样的问题,发现这是一个路径问题。我在 AMI 版本“2.4.2 (Hadoop 1.0.3) - 最新”上运行。

在我嵌入的 pig python 文件中,我必须在从 pig 导入任何内容之前将以下位置添加到 python 路径:

#!/usr/bin/python
sys.path.append('/home/hadoop/.versions/pig-0.11.1.1/lib/pig/pig-0.11.1.1-amzn.jar/Lib')
from org.apache.pig.scripting import *

然后 jython 解释器能够找到所有必要的 pig 模块。

于 2014-02-10T23:46:26.920 回答