尝试利用您的帖子: https ://gist.github.com/2884606
我尝试运行命令:
hadoop jar mongo-hadoop-streaming-assembly*.jar -mapper mapper.rb -reducer reducer.rb -inputURI mongodb://127.0.0.1/twitter.in -outputURI mongodb://127.0.0.1/twitter.out
得到以下错误:线程“main”中的异常 java.lang.ClassNotFoundException: com.mongodb.hadoop.streaming.MongoStreamJob
我编译了 jar mongo-hadoop-streaming-assembly*.jar 但它不包含上述类。
我尝试使用 -libjar 来包含类存档,但 hadoop 无法识别它。
还尝试导出 CLASS_PATH 以包含在上面。
用于构建 Hadoop Streaming https://github.com/mongodb/mongo-hadoop/tree/master/streaming
./sbt mongo-hadoop-streaming/组装