2

我从 Python 库mrjob开始了几个不同的工作,包括具有多个步骤的工作。如何streamjob用自定义名称替换?例如, wordcount_step_1,wordcount_step_2等。

Hadoop 管理的屏幕截图

4

2 回答 2

5

当然,只需在执行作业时使用--jobconf选项指定它。

例如:

if __name__ == '__main__':
    # Be careful, this appends all job args, if you have lots it could be a problem
    sys.argv.extend(["--jobconf", "mapred.job.name=%s" % " ".join(sys.argv)])
    MRYourJobClass.run()
于 2014-01-10T06:01:25.170 回答
0

运行作业时添加选项:

--jobconf mapred.job.name=NameOfTheJob
于 2016-09-13T15:17:15.117 回答