0

我使用 RevoScaleR 和 dplyrXdf 编写了一个脚本,令我惊讶的是,当使用 HDInsights(Microsoft Azure 托管 Spark 集群服务)时,我安装了 R 3.3.3,但我无法安装 dplyrXdf,存储库中的包也没有,我也无法安装使用 devtools 从 git 安装,我设法在从其各自的 github 存储库更新每个依赖项后安装它,但这太疯狂了,花了我几个小时......最大的问题似乎是 dplyr 0.5,这是该服务的最新可用包(当前的 CRAN 包是 0.7.4)我做错了吗?可能是配置中的某些东西(例如选择错误类型的集群)?我不敢相信 MS 会在 R 中投入这么多工作而不更新它的集群服务,我一定在这里遗漏了一些东西。

4

1 回答 1

0

您可以相当快地安装所有依赖项 - 我花了大约 20 分钟。只需查看错误消息并安装说明的软件包即可。我只需要这些

在此处输入图像描述

于 2018-03-14T14:34:26.147 回答