您在这里面临两个问题:
作业流失败
首先也是最重要的,触发Amazon EMR作业流程终止状态的问题让您感到恼火,可以立即解决:
我使用 Amazon Elastic MapReduce (Amazon EMR) 创建了一个作业流,但由于某些未知原因而失败。
作业流程失败的原因实际上可以从您提供的清单中的错误 2 中推断出来:
作业流程失败,原因是:无效的存储桶名称“testBucket”:存储桶名称只能包含小写字母、数字、句点 (.) 和短划线 (-)。[强调我的]
您的存储桶名称“testBucket”明显违反了规定的小写命名要求,因此仅将名称更改为小写(例如“testbucket”或“test-bucket”)将允许您根据需要运行作业流程。
终止状态
此外,Job Flow终止状态大概是没有问题的。虽然在极少数情况下可能会发生Amazon EC2实例或其他资源实际上卡在某种状态的情况,但您所看到的乍一看是完全合理和正常的:
我经常看到 EC2 实例的这种行为,它通常会在几个小时后从实例列表中消失。因此,我怀疑终止的工作流程同时从您的工作流程列表中消失了。
更新
我其实已经怀疑确实是这种情况,但在官方文档中仍然无法找到相关信息;但是,显然终止的工作流可能会以一种或另一种方式可见长达两个月,例如,参见 AWS 团队对Console 的响应未显示超过一个月的工作:
虽然控制台列出了所有正在运行的作业流,但它仅显示上个月启动的已终止作业流。或者,您可以使用 Ruby CLI列出过去两个月内启动的所有作业流程,使用以下命令:[...] [强调我的]