我尝试运行数据管道作业,但 EmrActivity 步骤达到了 FAILED 状态,但没有错误代码或错误消息:
名称:@EMR 集群执行工作_2013-09-03T16:15:00 查看实例字段说明:最近尝试次数:3,剩余尝试次数:0 选择此实例的尝试次数:
状态:失败错误代码:错误消息:
知道为什么吗?我在哪里可以找到有关潜在问题的更多信息?
工作很简单:启动 EMR 集群并运行一个 pig 脚本(其中 xxx 是我的存储桶名称):
{
“对象”:[
{
"id":"默认",
“failureAndRerunMode”:“级联”
},
{
"id" : "MyScheduleID",
“类型”:“时间表”,
"期间" : "1 小时",
“开始日期时间”:“2013-09-03T19:00:00”,
“结束日期时间”:“2013-09-03T20:00:00”
},
{
"id" : "MyEmrCluster",
"name" : "执行工作的 EMR 集群",
“类型”:“EmrCluster”,
“hadoopVersion”:“0.20”,
“masterInstanceType”:“m1.small”,
“coreInstanceType”:“m1.medium”,
“coreInstanceCount”:“2”,
"terminateAfter": "1 小时",
“日程”: {
"ref": "MyScheduleID"
},
"logUri":"s3://xxx/amazonlogs",
"emrLogUri":"s3://xxx/amazonlogs"
},
{
"id" : "MyEmrActivity",
"name" : "对我的数据执行的工作",
“类型”:“EmrActivity”,
“runsOn”:{“ref”:“MyEmrCluster”},
“日程”: {
"ref": "MyScheduleID"
},
“步骤”:“s3://us-east-1.elasticmapreduce/libs/script-runner/script-runner.jar,s3://us-east-1.elasticmapreduce/libs/pig/pig-script,- -base-path,s3://us-east-1.elasticmapreduce/libs/pig/,--install-pig,--pig-versions,latest",
“步骤”:“s3://us-east-1.elasticmapreduce/libs/script-runner/script-runner.jar,s3://us-east-1.elasticmapreduce/libs/pig/pig-script,- -base-path,s3://us-east-1.elasticmapreduce/libs/pig/,--pig-versions,latest,--run-pig-script,--args,-f,s3://xxx /carls_minimal_script.pig"
}
]
}
这个配置看起来好吗?我在 s3://xxx/amazonlogs 中看不到任何内容