问题标签 [ffbase]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
538 浏览

r - 如何与ff对象进行矩阵乘法

假设我有ff_matrix(也不适用于ffdf)名为xand的对象yx是一个 100*10 的矩阵,y是一个 10*1 的矩阵。

但是,x %*% y会导致Error in x %*% y : requires numeric/complex matrix/vector arguments.

0 投票
1 回答
130 浏览

r - 为什么合并不适用于从 ff_matrix 转换的 ffdf

为什么merge在下面不起作用?它给出错误`错误:

但是,如果我不进行强制转换,它会起作用:

0 投票
0 回答
165 浏览

r - 如何修复远程服务器上的 save.ffdf

我不能save.ffdfmove.ffdf。此外,已弃用的ffdfsave已损坏。

我会收到以下错误:

Error in文件名<-.ff (tmp, value = "/home/... Deleted .../path$X0.0.ff") : ff file rename from '/tmp/RtmpasUciV/ffdf346c5f0daaea.ff' to '/home/... Deleted .../path$X0.0.ff' failed

唯一可行的是:

请注意,当我在本地终端上调用它时,它可以工作。只是当我在远程服务器上尝试它时它不起作用。

我也会在上述错误下面得到错误:

0 投票
1 回答
1699 浏览

r - 在 R 中使用 ffdfdply 函数进行聚合

ffdfdply我尝试使用 R 中的函数使用 'ffbase' 包对大型数据集进行聚合。
假设我有三个变量,称为 Date、Item 和 sales。在这里,我想使用 sum 函数汇总 Date 和 Item 的销售额。您能否指导我了解 R 中的一些正确语法。
我在这里尝试过这样的操作:

我会很感激你的解决方案。

0 投票
1 回答
238 浏览

r - 写一个ff文件

我正在使用 R 上的大型矩阵,并尝试使用 ff 包来操作它们。

我有一个循环,它将创建称为 Var_sim (dim 25*7303) 的 n(n 可以是大小 1000)矩阵
我想以 ff 格式将矩阵保存在磁盘中(例如在我的文档中)。之后,如果我需要读取 n 个矩阵之一,我想用 R 和 ffload 加载它。这是我的代码:

但是 Data 中没有出现任何内容:我不知道 ffsave 是否是我正在寻找的功能。此外,我不知道如何指定将要创建的文件的名称。

感谢您的帮助

0 投票
1 回答
129 浏览

r - 在函数中使用具有创建名称的变量

我不知道我尝试做的是否可行!我有一个值矩阵(Var_sim),并将其转换为 ff 对象。该对象的名称是用“粘贴”创建的。现在我想在函数 ffload 中使用这个对象,这是我的代码:

在这里,我将变量 Mat_TEMP_4085_1 作为 ff 对象。我在一个循环中使用它,所以我将有各种具有不同名称(不同 cell_number)的 ff 对象。我需要在函数中使用 Mat_TEMP_4085_1 (和其他),但我不能只写名称:

我有以下错误:

它不识别变量。我能怎么做?

0 投票
1 回答
250 浏览

r - 不使用 ffload 创建副本

我对 ff 包中的函数属性有疑问。我要加载的特定目录中有一个 ff 对象。这就是我正在使用的:

使用 OVERWRITE=TRUE,对象的副本将保存在 tmp 文件夹中,并且将从该目录加载对象:

但是,如果您不想要对象的副本,则需要将 FALSE 覆盖。如果这是您第一次加载 ff 对象,即使 overwrite=FALSE,它也会在 tmp 文件夹中创建一个副本!然后我删除了副本,第二次重新加载了对象,我有以下消息并且没有副本:

问题是我正在处理很多大文件,我不想创建副本!我能做些什么 ?

0 投票
2 回答
1430 浏览

r - 合并和附加 ffdf 数据帧

我正在尝试通过合并和附加两个现有的 ffdf 数据框来创建一个 ffdf 数据框。ffdfs 具有不同的列数和不同的行数。我知道merge()只执行内连接和左外连接,而ffdfappend()如果列不相同则不允许追加。我想知道是否有人对此有解决方法。类似于 中的smartbind()函数的函数gtools package或任何其他解决方法。

当然,由于 ffdfs 的大小,转换回as.data.frame()和使用smartbind()不是一种选择。

任何帮助将不胜感激。

编辑:按照这里的建议是一个可重现的例子:

期望的结果应该是这样的(在 data.frames 上生成,如果我知道如何在 ffdfs 上生成它,我不会问这个问题):

我希望这能让我更清楚我试图实现的目标。

0 投票
2 回答
1131 浏览

r - 使用 FF 包在 R 中创建和重塑大数据的函数

我是 R 和 FF 包的新手,我试图更好地了解 FF 如何允许用户使用大型数据集(>4Gb)。我花了相当多的时间在网上搜索教程,但我能找到的那些通常都超出了我的想象。

我通过做学得最好,所以作为练习,我想知道如何使用任意值创建一个长格式的时间序列数据集,类似于 R 的内置“Indometh”数据集。然后我想把它重塑成宽幅。然后我想将输出保存为 csv 文件。

对于小型数据集,这很简单,可以使用以下脚本来实现:

但我想学习为大约 10 Gb 的文件大小执行此操作。我将如何使用 FF 包做到这一点?提前致谢。

0 投票
2 回答
356 浏览

r - 在 ff 对象中组合因子水平

我经常使用cut(). 因为cut()不明白时钟时间大约为零,所以我首先将时间分为三组(白天的任一侧的夜晚),然后合并两个“夜晚”因子水平。这可以通过将相同的“夜间”值两次赋予 来完成levels()。例如

现在我正在尝试对ff对象中的巨大数据集做同样的事情:

请注意,在这种情况下,levels()保留了三个因子水平,其中两个具有相同的标签。recodeLevels看起来很有希望,但并不完全一样:

我也尝试过cut()(实际上cut.ff())内重复的“夜间”标签,但它仍然返回三个级别,加上一个警告,即不推荐使用因子中的重复级别。

谢谢你的建议。