我正在尝试在我的 Amazon Elastic MapReduce 作业上启用错误输入跳过。我正在遵循这里描述的精彩食谱:
http://devblog.factual.com/practical-hadoop-streaming-dealing-with-brittle-code
上面的链接说我需要以某种方式在 EMR 作业上设置以下配置参数:
mapred.skip.mode.enabled=true
mapred.skip.map.max.skip.records=1
mapred.skip.attempts.to.start.skipping=2
mapred.map.tasks=1000
mapred.map.max.attempts=10
如何使用 Boto 在 JobFlow 上设置这些(和其他)mapred.XXX 参数?