我有一个 hadoop job fat jar,用于定期多次运行具有不同参数的作业。每个作业的启动时间似乎都非常长。我的猜测是胖罐子每次都会转移到任务跟踪器。我不想手动将作业 jar 添加到每个类路径。是否可以将整个作业 jar 传输到 dist 缓存并多次运行?
问问题
123 次
我有一个 hadoop job fat jar,用于定期多次运行具有不同参数的作业。每个作业的启动时间似乎都非常长。我的猜测是胖罐子每次都会转移到任务跟踪器。我不想手动将作业 jar 添加到每个类路径。是否可以将整个作业 jar 传输到 dist 缓存并多次运行?