我是 Hadoop 新手。我正在使用 Hadoop 0.22。在驱动程序中,我使用了以下代码:
Job job = Job.getInstance(configuration);
...
job.addArchiveToClassPath(new Path(JAR_DIR);
...
在 Map 类中,我必须使用什么代码将 jar 添加到本地类路径中?
更多细节
我有一个工作需要在地图和减少阶段 htmlunit.jar。我使用上面的代码将此 jar 添加到类路径中,但是当我提交工作时,我在使用 htmlunit 引用的行中有一个 ClassNotFoundException。如果上面的代码没关系,DistributedCache 会自动在 tasktrackers 类路径中添加 jar,可能是什么问题?提交作业时还必须使用选项 -libjars htmlunit.jar 吗?我必须使用另一个 hadoop 组件?