问题标签 [rhadoop]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3180 浏览

r - 将 R 数据帧写入 Hadoop Hive

我想将 R 中的数据框写入 Hadoop Hive 中的新表。我在 RODBC 包中使用 sqlSave(),如下所示。表结构是在 Hadoop 中创建的,但是在将任何数据插入表之前我得到一个错误。错误消息包含在下面。有关如何将 R 中的数据框写入 Hadoop 中的新表的任何建议?

代码

错误信息

0 投票
0 回答
117 浏览

r - RHADOOP 有问题吗?

我检查了这个问题:Rhadoop - wordcount using rmr 并尝试了我这边的答案。但它带来了很多问题。
这是代码:

以下是问题:

https://justpaste.it/143a0
我不明白这个问题以及这个特定问题的解决方案应该是什么。请帮助我,让我知道这个特定问题的解决方案是什么。
我正在使用最新版本的 RStudio-Server 和 R。

0 投票
2 回答
73 浏览

hadoop - 在 RHadoop 中运行“hdfs.put()”时出错

我正在为我的情绪分析项目使用 RHadoop。当我尝试运行hdfs.put()时,我收到以下错误:

谁能帮我这个?

0 投票
0 回答
283 浏览

hadoop - hadoop 流在 rstudio-server 中失败,错误代码为 1

我使用单节点。

我在 sudo R 中安装了 rmr2 和 hdfs

我在 rstudio-server 中写了一些代码。

但是,它发生了错误。

我不知道怎么了。

谢谢阅读。如果有人帮助我,我会很感激你。


执行日志:

0 投票
2 回答
9998 浏览

r - 容器运行超出虚拟内存限制

当我做 rhadoop 示例时,会发生以下错误。

正在超出虚拟内存限制。当前使用情况:已使用 1 GB 物理内存中的 121.2 MB;使用了 2.1 GB 的 2.1 GB 虚拟内存。杀死容器。

容器应要求被杀死。退出代码是 143

容器以非零退出代码 143 退出

hadoop 流式传输失败,错误代码为 1

我该如何解决?

我的hadoop设置。

mapred-site.xml

纱线站点.xml

0 投票
1 回答
282 浏览

r - 如何在 SQL Server 上为 hadoop 远程执行正常的 R 函数?

如何在不使用 Microsoft rx 函数的情况下在 SQL Server 上执行正常的 R 代码?我认为ComputeContext“RxInSqlServer”不是正确的吗?但我找不到关于其他 ComputeContext 选项的好信息。

本声明可以做到这一点吗?

还是我只能用它来执行 rx 功能?另一个选项可能是在 RStudio 或 VisualStudio 中设置服务器连接?

我的问题是:我想通过 SQL Server 上的 ODBC-Connection 分析来自 hadoop 的数据,所以我想使用远程 SQL Server 的性能而不是 SQL Server 中的数据。然后我想用 sparklyr 分析 hadoop 数据。

摘要:我想使用远程服务器的性能而不是 SQL Server 数据。所以 RStudio 不应该在本地运行,它应该执行和使用远程服务器的内存。

谢谢!

0 投票
0 回答
59 浏览

r - 将点(。)和逗号(,)放在一起的函数

任何使用 Rhadoop 的人都可能熟悉上面的代码。有人可以向我解释为什么“。”,即第一行函数中的点(。)和(,)并排放置的原因。请在回答时注意这是 R 的新手。

0 投票
0 回答
125 浏览

r - Im getting NULL for both key and value in rhadoop code

from.dfs(train.mr)

If I try to execute above type of code, I will get

Output is generating in rhadoop in a directory "/tmp/file" but Im not able to retrieve by using from.dfs("/tmp/file") If I mention backend = "local", i will get output, but if i give backend = "hadoop", i will get null values for key and value.

0 投票
1 回答
489 浏览

r - 如何在 R 3.3.2 上安装 Rhadoop?

我尝试了 Jinith 提到的以下内容:

如何安装 RHadoop 包(Rmr、Rhdfs、Rhbase)?

但我得到了这个例外:

“将包安装到'/home/user/R/x86_64-pc-linux-gnu-library/3.2'(因为'lib'未指定)警告:无效包'/home/user/Downloads/rmr2_3.3.2.tar。 gz' 错误:错误:未指定包 install.packages 中的警告:安装包 '/home/user/Downloads/rmr2_3.3.2.tar.gz' 的退出状态非零”

我不知道我该怎么办... :(

0 投票
0 回答
221 浏览

r - 用于多个输入文件的 Rhadoop mapreduce

我正在使用 R 构建一个 mapreduce 程序,该程序使用遗传算法从数据集中的一组特征中提取相关特征。我需要将许多文件作为我的 mapreduce 作业的输入。下面的代码是我的 mapreduce 程序,但它仅适用于一个输入文件 (data.csv)。

我将文件放在 hdfs 的一个文件夹中

这是地图功能

这是reduce函数

现在我申请 mapreduce 工作

然后我们从 hdfs 打印结果

或者

我尝试更改地图功能以使其适用于许多文件,但失败了

我可以在以前的地图功能中进行哪些更改以使其适用于许多输入文件?谢谢