我从http://www.cloudera.com/content/cloudera-content/cloudera-docs/DemoVMs/Cloudera-QuickStart-VM/cloudera_quickstart_vm.html下载的 Cloudera QuickStart VM 出现错误。
我正在尝试 Tom White 的Hadoop: The Definitive Guide book中的一个玩具示例map_temp.pig
,它“按年查找最高温度”。
我创建了一个名为的文件temps.txt
,每行包含(年份、温度、质量)条目:
1950 0 1
1950 22 1
1950 -11 1
1949 111 1
使用书中的示例代码,我在 Grunt 终端中输入了以下 Pig 代码:
records = LOAD '/home/cloudera/Desktop/temps.txt'
AS (year:chararray, temperature:int, quality:int);
DUMP records;
输入后DUMP records;
,我收到错误:
2014-05-22 11:33:34,286 [main] 错误 org.apache.pig.tools.grunt.Grunt - 错误 1066:无法打开别名记录的迭代器。后端错误:org.apache.hadoop.yarn.exceptions.ApplicationNotFoundException: 带有 id 'application_1400775973236_0006' 的应用程序在 RM 中不存在。
…</p>
日志文件中的详细信息:/home/cloudera/Desktop/pig_1400782722689.log
我试图通过谷歌搜索找出导致错误的原因:https://www.google.com/search?q=%22application+with+id%22+%22doesn%27t+exist+in+RM%22
.
那里的结果没有帮助。例如,http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-troubleshoot-error-vpc.html提到了这个错误并说“要解决这个问题,您必须配置一个包含 DHCP 的 VPC选项集,其参数设置为以下值..."
亚马逊建议的修复似乎不是问题,因为我没有使用 AWS。
编辑:
我认为 HDFS 文件路径是正确的。
[cloudera@localhost Desktop]$ ls
Eclipse.desktop gnome-terminal.desktop max_temp.pig temps.txt
[cloudera@localhost Desktop]$ pwd
/home/cloudera/Desktop