我目前有一个想使用 AWS 开发工具包复制的 hadoop 命令。
我当前使用的命令
hadoop jar /home/hadoop/contrib/streaming/hadoop-streaming.jar -input /no_dups -output /sorted -mapper mapper.py -reducer reducer.py -file mapper.py reducer.py other_file1.py other_file2.py
据我所知,StreamingStep
该类没有提供让 Hadoop 知道需要其他文件以及映射器和化简器的方法。
这个功能可用吗?