问题标签 [ffbase]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何与ff对象进行矩阵乘法
假设我有ff_matrix
(也不适用于ffdf
)名为x
and的对象y
。x
是一个 100*10 的矩阵,y
是一个 10*1 的矩阵。
但是,x %*% y
会导致Error in x %*% y : requires numeric/complex matrix/vector arguments
.
r - 为什么合并不适用于从 ff_matrix 转换的 ffdf
为什么merge
在下面不起作用?它给出错误`错误:
但是,如果我不进行强制转换,它会起作用:
r - 如何修复远程服务器上的 save.ffdf
我不能save.ffdf
或move.ffdf
。此外,已弃用的ffdfsave
已损坏。
我会收到以下错误:
Error in
文件名<-.ff (
tmp, value = "/home/... Deleted .../path$X0.0.ff") :
ff file rename from '/tmp/RtmpasUciV/ffdf346c5f0daaea.ff' to '/home/... Deleted .../path$X0.0.ff' failed
唯一可行的是:
请注意,当我在本地终端上调用它时,它可以工作。只是当我在远程服务器上尝试它时它不起作用。
我也会在上述错误下面得到错误:
r - 在 R 中使用 ffdfdply 函数进行聚合
ffdfdply
我尝试使用 R 中的函数使用 'ffbase' 包对大型数据集进行聚合。
假设我有三个变量,称为 Date、Item 和 sales。在这里,我想使用 sum 函数汇总 Date 和 Item 的销售额。您能否指导我了解 R 中的一些正确语法。
我在这里尝试过这样的操作:
我会很感激你的解决方案。
r - 写一个ff文件
我正在使用 R 上的大型矩阵,并尝试使用 ff 包来操作它们。
我有一个循环,它将创建称为 Var_sim (dim 25*7303) 的 n(n 可以是大小 1000)矩阵
我想以 ff 格式将矩阵保存在磁盘中(例如在我的文档中)。之后,如果我需要读取 n 个矩阵之一,我想用 R 和 ffload 加载它。这是我的代码:
但是 Data 中没有出现任何内容:我不知道 ffsave 是否是我正在寻找的功能。此外,我不知道如何指定将要创建的文件的名称。
感谢您的帮助
r - 在函数中使用具有创建名称的变量
我不知道我尝试做的是否可行!我有一个值矩阵(Var_sim),并将其转换为 ff 对象。该对象的名称是用“粘贴”创建的。现在我想在函数 ffload 中使用这个对象,这是我的代码:
在这里,我将变量 Mat_TEMP_4085_1 作为 ff 对象。我在一个循环中使用它,所以我将有各种具有不同名称(不同 cell_number)的 ff 对象。我需要在函数中使用 Mat_TEMP_4085_1 (和其他),但我不能只写名称:
我有以下错误:
它不识别变量。我能怎么做?
r - 不使用 ffload 创建副本
我对 ff 包中的函数属性有疑问。我要加载的特定目录中有一个 ff 对象。这就是我正在使用的:
使用 OVERWRITE=TRUE,对象的副本将保存在 tmp 文件夹中,并且将从该目录加载对象:
但是,如果您不想要对象的副本,则需要将 FALSE 覆盖。如果这是您第一次加载 ff 对象,即使 overwrite=FALSE,它也会在 tmp 文件夹中创建一个副本!然后我删除了副本,第二次重新加载了对象,我有以下消息并且没有副本:
问题是我正在处理很多大文件,我不想创建副本!我能做些什么 ?
r - 合并和附加 ffdf 数据帧
我正在尝试通过合并和附加两个现有的 ffdf 数据框来创建一个 ffdf 数据框。ffdfs 具有不同的列数和不同的行数。我知道merge()
只执行内连接和左外连接,而ffdfappend()
如果列不相同则不允许追加。我想知道是否有人对此有解决方法。类似于 中的smartbind()
函数的函数gtools package
或任何其他解决方法。
当然,由于 ffdfs 的大小,转换回as.data.frame()
和使用smartbind()
不是一种选择。
任何帮助将不胜感激。
编辑:按照这里的建议是一个可重现的例子:
期望的结果应该是这样的(在 data.frames 上生成,如果我知道如何在 ffdfs 上生成它,我不会问这个问题):
我希望这能让我更清楚我试图实现的目标。
r - 使用 FF 包在 R 中创建和重塑大数据的函数
我是 R 和 FF 包的新手,我试图更好地了解 FF 如何允许用户使用大型数据集(>4Gb)。我花了相当多的时间在网上搜索教程,但我能找到的那些通常都超出了我的想象。
我通过做学得最好,所以作为练习,我想知道如何使用任意值创建一个长格式的时间序列数据集,类似于 R 的内置“Indometh”数据集。然后我想把它重塑成宽幅。然后我想将输出保存为 csv 文件。
对于小型数据集,这很简单,可以使用以下脚本来实现:
但我想学习为大约 10 Gb 的文件大小执行此操作。我将如何使用 FF 包做到这一点?提前致谢。
r - 在 ff 对象中组合因子水平
我经常使用cut()
. 因为cut()
不明白时钟时间大约为零,所以我首先将时间分为三组(白天的任一侧的夜晚),然后合并两个“夜晚”因子水平。这可以通过将相同的“夜间”值两次赋予 来完成levels()
。例如
现在我正在尝试对ff
对象中的巨大数据集做同样的事情:
请注意,在这种情况下,levels()
保留了三个因子水平,其中两个具有相同的标签。recodeLevels
看起来很有希望,但并不完全一样:
我也尝试过cut()
(实际上cut.ff()
)内重复的“夜间”标签,但它仍然返回三个级别,加上一个警告,即不推荐使用因子中的重复级别。
谢谢你的建议。