问题标签 [distributed-r]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3011 浏览

r - R中的分布式计算

我制定了一个估算器,我想通过用 R 进行模拟研究来检查它的性能。我想重复这个实验 500 次。不幸的是,估计器中涉及的计算是复杂的。在我的桌面上,每次复制需要 15 分钟。我正在寻找一些使用 R 的分布式计算方法。我应该如何开始?我用谷歌搜索了这个主题。有很多关于这个的帖子。

0 投票
1 回答
85 浏览

distributed-r - 工人无法在分布式 R 中启动

当我运行这个命令时:

我收到此错误:

这是我的配置文件:

我的主日志文件是R_master_hduser_10.234.31.166.50000.log

日志文件消息:

我已经尝试过这个论坛中提到的所有步骤,比如主人可以在没有密码的情况下登录工人。我还交叉检查了所有系统.bashrc中的路径条目DISTRIBUTED_HOME,它没有创建任何工作日志文件。似乎工人无法与主人握手。

有谁知道如何解决这个问题?

0 投票
0 回答
55 浏览

r - 我们如何将自定义函数作为参数发送到分布式R中的foreach?

在 R 分布式数据框中,我正在尝试使用时间戳对数据进行子集化,在数据框的子集中,我想用特定列的最常见值填充“NA”,或者我想使用定义的自定义函数来填充'NA's

数据集如下

基于 t1 的子集

基于 t2 的子集

从试图用该列的频繁出现值替换 NA 的两个子集中

并且预期的输出是