我想弄清楚如何设置引用 HDFS 的类路径?我找不到任何参考。
java -cp "how to reference to HDFS?" com.MyProgram
如果我无法引用 hadoop 文件系统,那么我必须将所有引用的第三方库/jar 复制到每台 hadoop 机器上 $HADOOP_HOME 下的某个位置……但我想通过将文件放入 hadoop 文件系统来避免这种情况。这可能吗?
程序运行的示例hadoop命令行(我的期望是这样的,也许我错了):
hadoop jar $HADOOP_HOME/contrib/streaming/hadoop-streaming-1.0.3.jar -input inputfileDir -output outputfileDir -mapper /home/nanshi/myprog.java -reducer NONE -file /home/nanshi/myprog.java
但是,在上面的命令行中,我如何添加 java 类路径?比如 -cp "/home/nanshi/wiki/Lucene/lib/lucene-core-3.6.0.jar:/home/nanshi/Lucene/bin"