问题标签 [revoscaler]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Azure / R-server - rxKmeans 写入没有标题的文件
我正在 Azure / R-server 中进行 kmeans 集群,并且需要能够编写没有标头的文件。
到目前为止,我已经尝试过:
我得到这个错误:
我也试过:
返回:
还有其他建议吗?
r - 如何使用 RevoScaleR 逐块读取 SAS 数据并输出为 xdf 以外的格式?
我正在尝试使用 RevoScaleR 开发一些代码,并注意到它具有类似的选项,rowsPerRead
并且可以使用 rxImport 方法以块的形式输出 xdf 文件。但是我的用例我想应用一些自定义转换(对整个块;不仅仅是列)并以 fst 格式而不是 xdf 输出结果(因为我发现它更快)。
有没有办法使用 RevoScaleR 对正在读取的每个块应用客户转换?
r - Azure / R-server - head 导致进程挂起
我正在尝试head
通过 RStudio 使用 R-server 将命令用于 Azure 中的 hdfs 数据集。这在过去是有效的,但在过去的两天里,它似乎停止了工作。当我执行它时,它告诉我进程已经开始运行,但从不打印任何东西。
rxGetInfo
似乎在相同的数据上工作正常。有什么想法可以检查为什么会发生这种情况?
r - RevoScaleR rxDataStep rowselection fails when using variable
I am trying to perform a selection on a xdf file with rxDataStep. I am using rowSelection and it works when I use explicit values but not when I use a variable, e.g.: this works:
but this does not:
it fails with the message:
What is wrong here? I've been strugling with this for hours, tried every single sintax I found on the web. Thanks.
python - 使用 revoscalepy 将数据插入数据库
啊,在那里,
是否有可能使用revoscalepy
包将值插入表中?
我会期待一些类似的东西:
但我找不到这样的东西。最接近的选项似乎是rx_write_object,它将数据帧作为二进制文件转储到表中。更多关于使用的信息可以在 R-package 网站上找到。然而,这并不能解决我的问题,因为我认为数据不在一个二进制 blob 中。
关于这个问题的一些背景:在特征生成过程中,我创建了多个特征,我想将它们存储在数据库中以备后用。理论上,我可以创建一个包含所有功能和元数据的最终数据框,并使用一些触发器将数据转储到正确的表中,但在此之前,我宁愿安装pymssql
.
有什么线索吗?
Ps.:如果有人知道此类问题的正确标签,请告诉我...
r - 由于旧库,我无法在 hdinsights 中使用 dplyrXdf
我使用 RevoScaleR 和 dplyrXdf 编写了一个脚本,令我惊讶的是,当使用 HDInsights(Microsoft Azure 托管 Spark 集群服务)时,我安装了 R 3.3.3,但我无法安装 dplyrXdf,存储库中的包也没有,我也无法安装使用 devtools 从 git 安装,我设法在从其各自的 github 存储库更新每个依赖项后安装它,但这太疯狂了,花了我几个小时......最大的问题似乎是 dplyr 0.5,这是该服务的最新可用包(当前的 CRAN 包是 0.7.4)我做错了吗?可能是配置中的某些东西(例如选择错误类型的集群)?我不敢相信 MS 会在 R 中投入这么多工作而不更新它的集群服务,我一定在这里遗漏了一些东西。
r - RStudio 未在 Ubuntu 16.04 上加载 RevoScaleR
长话短说:
在终端 R 会话中
调用rxImport()
工作正常,但在使用 RStudio 时失败,尽管使用了相同的 R 安装。
设置:
我想在 Ubuntu 上使用像 rxImport(...) 这样的 RevoScaleR 函数。我通过包管理器完成了 RStudio 和 R 的安装。
我已经按照此处的说明安装了 MS Rclient 。一切似乎都正常,因为我可以在终端中运行:
因此该功能已加载并默认可用。现在我通过在末尾添加以下内容来告诉 RStudio 使用 R 的此安装~/.profile
:
错误:
当我运行时,rstudio
我在 IDE 中得到一个 R 控制台,上面写着:
可能的原因
我发现一些人抱怨 MS 包没有正确处理~
和工作目录(即在远程服务器上),setwd()
但并没有解决我的问题。
您对如何让 RevoScaleR 与 RStudio 一起工作有任何想法吗?提前致谢。
r - 按 XDF 文件分组?
假设我有一个使用 RevoScaleR 生成的巨大源 XDF 文件。我想通过对列 A、B、C 上的源条目进行分组来创建一个新的目标 XDF,并计算列 D 上的总和、最小值、最大值、平均值、标准偏差。
让我们假设目标数据太大而无法放入内存。我应该如何进行?我在文档中找不到有关按操作分组的太多信息。
r - Microsoft ML 服务器/R 客户端包问题
我的系统中安装了 microsoft ML server/R Client。但是当我尝试加载包时,它会给出如下版本错误:
这个问题存在于很多包中。所以我尝试查看存储库。
我尝试只从第一个链接下载,但仍然只下载旧版本。