问题标签 [revolution-r]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
440 浏览

revolution-r - rxDataStep 使用滞后值

在 SAS 中,它可以遍历数据集并使用滞后值。

我这样做的方法是使用一个执行“滞后”的函数,但这可能会在块的开头产生错误的值。例如,如果一个块从第 200,000 行开始,那么它将假设一个滞后值的 NA 应该来自第 199,999 行。

有解决方案吗?

0 投票
1 回答
111 浏览

r - 革命 R:使用另一个 xdf 过滤一个 xdf

我正在尝试过滤一个非常大的 xdf 文件(位于 cloudera 上),in以将其与另一个 xdf 文件(位于 cloudera 上)进行比较。

如果我尝试:

我收到一个错误,param$1说不能对 s4 类的对象进行子集化。如 xdf 数据对象不能被子集化。有没有办法解决?我宁愿不将 xdf 转换为本地 csv 文件,因为它非常大。

0 投票
1 回答
607 浏览

r - R-将工作目录设置为hdfs

我需要从 R 中非常大的数据集创建一些数据框。有没有办法更改我的工作目录,以便将我创建的 R 对象保存到 hdfs 中?我在/home 下没有足够的空间来保存这些大数据框,但是我需要使用一些需要数据框作为输入的数据框函数。

0 投票
0 回答
350 浏览

r - 在 hadoop 计算上下文中合并两个 xdf 文件

我有两个 RxXdfData 数据源,我想将它们合并到 RxHadoopMR 计算上下文中的某个列上。

我的两个 xdf 数据源都很大并且存在于 hdfs 上。我们如何合并它们?

我尝试了 RxDataStep 附加选项,但革命 r 抱怨,它不能采用复合 xdf 文件并建议我改用 rxExec。

我知道这可以在本地计算上下文中使用 rxMerge 函数来完成,但是我必须执行以下步骤:

  1. 将数据复制到边缘节点(本地上下文)
  2. 制作 .xdf 文件
  3. 使用 rxMerge 合并 .xdf 文件
  4. 将输出 .xdf 文件转换为 txt/csv 格式
  5. 将 txt/csv 文件传输到 hdfs
  6. 再次使用 rxImport 将这些文本文件转换回复合 xdf 文件

我想这么长的简单合并过程有点过头了。

请帮助我解决此问题的任何最佳解决方案。

编辑:我也在revolution r支持论坛@ https://revolutionanalytics.zendesk.com/entries/53777899-Merging-two-composite-xdf-files-上问过同样的问题

但是到现在我还没有收到任何回复。

0 投票
1 回答
280 浏览

r - 我应该使用哪些函数来处理 HDFS 上的 XDF 文件?

我在 HDFS 集群上有一个 .xdf 文件,大约 10 GB,有近 70 列。我想将它读入一个 R 对象,以便我可以执行一些转换和操作。我试着用谷歌搜索它并提出了两个功能:

谁能告诉我首选的功能,因为我想读取数据并在集群的每个节点上并行执行转换?

此外,如果我以块的形式读取和执行转换,是否必须合并每个块的输出?

提前感谢您的帮助。

干杯,阿米特

0 投票
1 回答
262 浏览

r - 从 .Xdf 文件中删除重复记录

我想从我的大 .xdf 文件 trans.xdf 中删除重复记录。这是文件详细信息:

以下是该文件的示例数据:

我尝试使用 rxDataStep 函数来使用它的 transform 参数在 .xdf 文件上调用 unique() 函数。下面是相同的代码:

但是出现以下错误:

所以任何人都可以指出我在这里做的错误,或者是否有更好的方法从 .Xdf 文件中删除重复记录。我避免将数据加载到内存数据帧中,因为数据非常庞大。

我正在通过 HDFS 在 Revolution R Environment 中运行上述代码。

如果可以通过任何其他方法获得相同的结果,那么将理解相同的示例。

我在这里先向您的帮助表示感谢 :)

干杯,

阿米特

0 投票
0 回答
110 浏览

r - 输出源中没有写入数据:rxDataStepXdf 函数

我已经执行了下面的代码,用于从 .xdf 文件中选择行和列并创建一个新的 .xdf 文件,但它不起作用。以下是执行后显示的代码和消息:

信息 :

下面是 .Xdf 文件结构:

只想根据某些条件过滤行和列,但未创建输出 .xdf 文件。

我运行代码的环境:

谁能指出我在这里做的错误。

感谢您提前提供的帮助.... :)

干杯,

阿米特

0 投票
1 回答
200 浏览

r - rxCall 中的错误(“RxMergeXdf”,参数)

我正在尝试合并两个 .Xdf 文件,下面是相同的代码:

但在执行时出现此错误:

输出 .xdf 文件的大小为 260 字节,但无法打开。当尝试使用 rxGetInfoXdf 获取此 .Xdf 的详细信息时,它显示以下消息:

下面是两个 .Xdf 文件的文件结构:

1) se_lif_1.xdf

2) ext_merchant_account_filtered.xdf:

任何人都可以帮我解决这个问题。我查看了代码,但对我来说一切都很好。

感谢您提前提供的帮助... :)

干杯,

阿米特

0 投票
2 回答
2028 浏览

r - rxImport 中的错误:预期为 8

我正在尝试读取 R 中包含 35.000.000 行和 105 列的文件,并决定使用 Revolution R Enterprise 7.4,代码如下:

但代码抛出以下错误:

Error in doTryCatch(return(expr), name, parentenv, handler) : Write error: expected 8 got

有谁知道我该如何解决这个错误?

谢谢

0 投票
1 回答
270 浏览

r - 使用 rxImport 函数将 CSV 文件读入 .Xdf 文件时抑制双引号内的逗号

我正在尝试使用带有以下代码的函数将大.CSV文件转换为文件:.XdfrxImport()

但是此文件包含许多记录,例如:

如您所见,双引号内的列AD_LINE_1_TX&包含逗号。AD_LINE_2_TX

我尝试使用该type = "text"参数,但随后它读取第一列,即SE_NO即使numeric它的类型显示为character. 这是numeric我想以character.

如果我使用transform参数将列转换character为:

然后在从字符(指数表示)到数字的转换中,SE_NO列的值从0200001097变为。02000010002.000011e+08

那么有没有其他方法可以在不影响其他列的情况下抑制双引号内的逗号?

如果需要任何进一步的信息,请告诉我。