问题标签 [revoscaler]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
82 浏览

r - Azure / R-server - rxKmeans 写入没有标题的文件

我正在 Azure / R-server 中进行 kmeans 集群,并且需要能够编写没有标头的文件。

到目前为止,我已经尝试过:

我得到这个错误:

我也试过:

返回:

还有其他建议吗?

0 投票
1 回答
108 浏览

r - 如何使用 RevoScaleR 逐块读取 SAS 数据并输出为 xdf 以外的格式?

我正在尝试使用 RevoScaleR 开发一些代码,并注意到它具有类似的选项,rowsPerRead并且可以使用 rxImport 方法以块的形式输出 xdf 文件。但是我的用例我想应用一些自定义转换(对整个块;不仅仅是列)并以 fst 格式而不是 xdf 输出结果(因为我发现它更快)。

有没有办法使用 RevoScaleR 对正在读取的每个块应用客户转换?

0 投票
0 回答
12 浏览

r - Azure / R-server - head 导致进程挂起

我正在尝试head通过 RStudio 使用 R-server 将命令用于 Azure 中的 hdfs 数据集。这在过去是有效的,但在过去的两天里,它似乎停止了工作。当我执行它时,它告诉我进程已经开始运行,但从不打印任何东西。

rxGetInfo似乎在相同的数据上工作正常。有什么想法可以检查为什么会发生这种情况?

0 投票
1 回答
291 浏览

r - RevoScaleR rxDataStep rowselection fails when using variable

I am trying to perform a selection on a xdf file with rxDataStep. I am using rowSelection and it works when I use explicit values but not when I use a variable, e.g.: this works:

but this does not:

it fails with the message:

What is wrong here? I've been strugling with this for hours, tried every single sintax I found on the web. Thanks.

0 投票
1 回答
528 浏览

python - 使用 revoscalepy 将数据插入数据库

啊,在那里,

是否有可能使用revoscalepy包将值插入表中?

我会期待一些类似的东西:

但我找不到这样的东西。最接近的选项似乎是rx_write_object,它将数据帧作为二进制文件转储到表中。更多关于使用的信息可以在 R-package 网站上找到。然而,这并不能解决我的问题,因为我认为数据不在一个二进制 blob 中。

关于这个问题的一些背景:在特征生成过程中,我创建了多个特征,我想将它们存储在数据库中以备后用。理论上,我可以创建一个包含所有功能和元数据的最终数据框,并使用一些触发器将数据转储到正确的表中,但在此之前,我宁愿安装pymssql.

有什么线索吗?

Ps.:如果有人知道此类问题的正确标签,请告诉我...

0 投票
1 回答
41 浏览

r - 由于旧库,我无法在 hdinsights 中使用 dplyrXdf

我使用 RevoScaleR 和 dplyrXdf 编写了一个脚本,令我惊讶的是,当使用 HDInsights(Microsoft Azure 托管 Spark 集群服务)时,我安装了 R 3.3.3,但我无法安装 dplyrXdf,存储库中的包也没有,我也无法安装使用 devtools 从 git 安装,我设法在从其各自的 github 存储库更新每个依赖项后安装它,但这太疯狂了,花了我几个小时......最大的问题似乎是 dplyr 0.5,这是该服务的最新可用包(当前的 CRAN 包是 0.7.4)我做错了吗?可能是配置中的某些东西(例如选择错误类型的集群)?我不敢相信 MS 会在 R 中投入这么多工作而不更新它的集群服务,我一定在这里遗漏了一些东西。

0 投票
1 回答
134 浏览

sql-server - revoscaler sqlServerdData rxImport uniqueidentifier 列失败

我正在尝试从 SQL Server 导入数据,但在导入包含 uniqueidentifier 列类型的表时遇到问题。

我正在使用 R Client 3.3.2.0 来查询数据库。

数据库表:

在此处输入图像描述

代码:

错误:

0 投票
1 回答
429 浏览

r - RStudio 未在 Ubuntu 16.04 上加载 RevoScaleR

长话短说:
在终端 R 会话中 调用rxImport()工作正常,但在使用 RStudio 时失败,尽管使用了相同的 R 安装。

设置:
我想在 Ubuntu 上使用像 rxImport(...) 这样的 RevoScaleR 函数。我通过包管理器完成了 RStudio 和 R 的安装。

我已经按照此处的说明安装了 MS Rclient 。一切似乎都正常,因为我可以在终端中运行:

因此该功能已加载并默认可用。现在我通过在末尾添加以下内容来告诉 RStudio 使用 R 的此安装~/.profile

错误:
当我运行时,rstudio我在 IDE 中得到一个 R 控制台,上面写着:

可能的原因
我发现一些人抱怨 MS 包没有正确处理~和工作目录(即在远程服务器上),setwd()但并没有解决我的问题。

您对如何让 RevoScaleR 与 RStudio 一起工作有任何想法吗?提前致谢。

0 投票
2 回答
140 浏览

r - 按 XDF 文件分组?

假设我有一个使用 RevoScaleR 生成的巨大源 XDF 文件。我想通过对列 A、B、C 上的源条目进行分组来创建一个新的目标 XDF,并计算列 D 上的总和、最小值、最大值、平均值、标准偏差。

让我们假设目标数据太大而无法放入内存。我应该如何进行?我在文档中找不到有关按操作分组的太多信息。

0 投票
1 回答
349 浏览

r - Microsoft ML 服务器/R 客户端包问题

我的系统中安装了 microsoft ML server/R Client。但是当我尝试加载包时,它会给出如下版本错误:

这个问题存在于很多包中。所以我尝试查看存储库。

我尝试只从第一个链接下载,但仍然只下载旧版本。