我是 Amazon Services 的新手,并尝试在 Amazon EMR 中运行该应用程序。
为此,我已按照以下步骤操作:
1) 创建了包含 --> create table 的 Hive 脚本,在 Hive 中使用一些文件加载数据语句并从命令中选择 *。
2) 创建 S3 存储桶。我将对象加载到其中:Hive 脚本,文件加载到表中。
3) 然后创建作业流程(使用示例 Hive 程序)。给定输入、输出和脚本路径(如 s3n://bucketname/script.q、s3n://bucketname/input.txt、s3n://bucketname/out/)。没有创建目录。我认为它会自动创建。
4) 然后 Job Flow 开始运行,一段时间后我看到状态为 STARTING、BOOTSTRAPING、RUNNING 和 SHUT DOWN。
5) 在运行 SHUT DOWN 状态时,它会自动终止,显示 SHUT DOWN 的 FAILES 状态。
然后在 S3 上,我没有看到 out 目录。如何查看输出?我看到了守护进程、节点等目录......
以及如何在 Amazon EMR 中查看来自 HDFS 的数据?