问题标签 [ffbase]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
984 浏览

r - 替换 ffdf 对象中的 NA

我正在使用在某些列中具有 NA 的 ffdf 对象。NA 是使用merge.ffdf进行左外部合并的结果。我想用 0 替换 NA,但无法做到。这是我正在运行的代码:

知道我做错了什么吗?一般来说,我想了解更多关于替换 ff 和 ffdf 类的方法。有什么建议可以让我找到有关该主题的一些示例吗?

0 投票
1 回答
1239 浏览

r - 删除行ff包

一段时间以来,我一直在使用 ff 包来处理大数据。我使用过的 R 对象有大约 130.000.000 行和 14 列。其中两列温度和降水缺少值“NA”,因此我需要删除这些行才能继续我的工作。我一直在尝试像在普通 R 对象中那样做:

但我不断收到错误消息:

有没有人能够删除 ffdf 对象中的行?我会很感激任何帮助。

0 投票
3 回答
2104 浏览

r - ff 包写入错误

我正在尝试使用 R 处理 1909x139352 数据集。由于我的计算机只有 2GB 的 RAM,因此数据集对于传统方法来说太大(500MB)。所以我决定使用这个ff包。但是,我遇到了一些麻烦。该函数read.table.ffdf无法读取第一块数据。它崩溃并出现下一个错误:

有谁知道发生了什么?

0 投票
3 回答
2435 浏览

r - R ff 包 ffsave 'zip' 未找到

可重现的例子:

系统:Windows 7 64 位,R 15.2 64 位

已安装 Rtools

zip 300xn-x64 和 unzip 600xn 文件夹已设置为 windows 路径

cmd 行工作,键入 zip 或解压缩它显示功能信息

需要帮忙!任何建议表示赞赏。

0 投票
4 回答
9675 浏览

r - 如何在 R 中执行大型数据集的完全外连接?

我正在尝试在 R 中对一组中型数据集进行数据分析。我需要做的一项分析要求我对大约 24-48 个文件进行完全外部连接,每个文件有大约 60 列和多达 450,000 行。所以我经常遇到内存问题。

我认为 ffbase 或 sqldf 会有所帮助,但显然它们中的任何一个都不可能完全外连接。

有解决方法吗?我还没有找到的包裹?

0 投票
1 回答
929 浏览

r - R中的ffdfdply,拆分和内存限制

我在使用 ff/ffdf 和 ffdfdply 函数时遇到“错误:无法分配大小为 ...MB 的向量”问题。

我正在尝试使用 ff 和 ffdf 包来处理已键入组的大量数据。数据(ffdf 表格格式)如下所示:

唯一键是使用以下内容创建的:

通过使用 key 变量进行分组来总结,我有这个命令:

使用 data.table 出色的分组功能(取自本次讨论的想法)。在实际代码中,有更多函数可应用于 Amount 变量,但即使这样,我也无法处理完整的 ffdf 表(表的较小子集可以正常工作)。

似乎 ffdfdplyis 使用了大量的内存,给出:

BATCHBYTES 似乎也没有帮助。任何有 ffdffply 经验的人都可以推荐任何其他方法来解决这个问题,而无需将 ffdf 表预先拆分成块?

0 投票
1 回答
817 浏览

r - 使用 load.ffdf 将 ff / ffbase 文件加载到 R 会话中

我有一个ffdf保存到磁盘的大型数据框,我需要将其加载到新的R会话中。当我load.ffdf在文件所在的目录中运行时,我收到以下错误消息:

我真的很想阅读这些文件。有没有办法鼓励他们被阅读?有没有办法直接读取各个ff列文件?它们是什么格式的?也许我可以将它们手动放置在底层ff包使用的临时位置?

我已经浏览了save.ffdfandload.ffdf函数,但这并没有给我任何简单的修复。

背景:我最初将数据框保存custTrans到默认./ffdb目录。我实际上希望它们在目录中./custTrans,所以我曾经move.ffdf移动文件。列文件被移动,但.RData.Rprofile文件没有被移动。我试图从./ffdb目录加载数据,.RData并将.Rprofile文件复制到./custTrans目录并在load.ffdf那里运行。我还尝试将数据文件移回./ffdb目录。错误信息是一样的。

0 投票
1 回答
3466 浏览

r - 如何按日期对 R 中的大数据框(ffdf)进行子集化?

我正在尝试按日期对 FFDF 进行子集化。下面,我已经使用普通数据框成功创建了这样一个子集。但是我需要一些帮助才能将其应用于 FFDF。我的尝试以及错误消息都列在代码注释中。提前谢谢了!

0 投票
1 回答
537 浏览

r - 如何将 ffdf 转换为 ff

我正在使用包中的read.table.ffdf函数ff来读取一个巨大的数字矩阵。然后如何在不首先转换为 RAM的情况下将此生成ffdf的对象转换为对象?ff

0 投票
1 回答
91 浏览

r - 具有多个不同键的叉积的 R 包 ff 失败

在尝试创建多个不同键的交叉产品时,我在使用 ff 包时遇到了困难。使用 expand.ffgrid(),在传递单个 ff 对象时没有问题,如下所示:

test_ff <- expand.ffgrid(a=ff(c(0,1,2)), b=ff(c(0,1))) #-- Runs fine

但是,为了在我不知道传入的 ff 对象数量的环境中进行生产,我想将这些对象作为列表传递,如下所示

test_ff <- expand.ffgrid(list(a=ff(c(0,1,2)), b=ff(c(0,1)))) #-- This fails

该文档暗示(不是很清楚)这应该是可能的,并且此语法使用 expand.grid() 可以正常工作。这个功能还没有在 ff 中实现还是我遗漏了什么?

我最初的问题是在多个数据帧上创建一个完整的外部连接——这在 ff 中并不容易(或不可能?)真的让我头疼!