在我的流式传输作业中,我想在 mapper 中调用一个可执行文件。是这样的
映射器.py
print os.popen('./binary').read()
命令是
$HADOOP_HOME/bin/hadoop fs -rmr $HADOOP_OUTPUT
$HADOOP_HOME/bin/hadoop streaming \
-D mapred.map.tasks=$MAP_NUM \
-D mapred.reduce.tasks=$RED_NUM \
-D mapred.job.map.capacity=500 \
-D mapred.map.capacity.per.tasktracker=1 \
-input $HADOOP_INPUT \
-output $HADOOP_OUTPUT \
-mapper mapper.py \
-file mapper.py binary\
但结果是,二进制文件没有执行。我不知道为什么。谁能帮我