1

我已经在 Horton Hadoop 上安装了 RStudio 3.1。

目前我的 Hadoop Streaming 环境变量是使用这个路径设置的 export HADOOP_STREAMING=/usr/lib/hadoop-mapreduce/hadoop-streaming.jar

使用 RStudio 执行简单的 mapreduce 时出现错误

hadoop.streaming() 中的错误:请确保 env. 变量 HADOOP_STREAMING 已设置

谁能告诉我 hadoop-streaming jar 文件的正确路径是什么?谢谢。

4

1 回答 1

2

这取决于您在哪里安装了 hadoop 库,例如,如果您使用的是 cloudera 发行版,则可以在 R 中使用以下内容:

Sys.setenv(HADOOP_STREAMING = "/opt/cloudera/parcels/CDH-5.1.3-1.cdh5.1.3.p0.12/lib/hadoop-mapreduce/hadoop-streaming.jar")
于 2014-10-10T23:41:07.433 回答