0
  input_lines = LOAD '/inputs/AboutMe' AS (line:chararray);

一旦我使用 {dump input_lines;},我就会收到错误 1066,即无法打开别名 input_lines 的迭代器。

AboutMe 是我试图读取的文件,它位于输入的 hdfs 目录中。我能够阅读它,我已经仔细检查了它。

Hadoop 版本hadoop-2.5.0-cdh5.3.2,Pig 版本“ pig-0.12.1 ”。我的 Ubuntu 版本是Ubuntu 14.04.5 LTS

我的.bashrc文件有

export JAVA_HOME="/usr/lib/jvm/java-8-oracle"
export HADOOP_PREFIX="/home/yadav/hadoop-2.5.0-cdh5.3.2"
export PATH=$PATH:$HADOOP_PREFIX/bin
export PATH=$PATH:$HADOOP_PREFIX/sbin
export HADOOP_MAPRED_HOME=${HADOOP_PREFIX}
export HADOOP_COMMON_HOME=${HADOOP_PREFIX}
export HADOOP_HDFS_HOME=${HADOOP_PREFIX}
export YARN_HOME=${HADOOP_PREFIX}
export HIVE_HOME=/home/yadav/apache-hive-0.13.1-bin
export PATH=$PATH:$HIVE_HOME/bin
export PIG_HOME=/home/yadav/pig-0.12.1
export PATH=$PATH:$PIG_HOME/bin
export PIG_CLASSPATH="/home/yadav/hadoop-2.5.0-cdh5.3.2/conf"

我已经尝试过两种方式,即

a) 从本地模式运行 pig grunt shell 并从本地加载输入文件

b) 从 hadoop 模式运行 pig grunt shell 并从 hdfs 目录加载输入文件

4

0 回答 0