当前版本的 hadoop-streaming 需要一个用于组合器的 Java 类,但我在某处读到我们可以使用如下 hack:
hadoop jar ./contrib/streaming/hadoop-0.20.2-streaming.jar -input /testinput -output /testoutput -mapper "python /code/triples-mapper.py | sort | python /code/triples-reducer.py" -reducer /code/triples-reducer.py
但是,这似乎不起作用。我究竟做错了什么?