问题标签 [ffbase]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 替换 ffdf 对象中的 NA
我正在使用在某些列中具有 NA 的 ffdf 对象。NA 是使用merge.ffdf进行左外部合并的结果。我想用 0 替换 NA,但无法做到。这是我正在运行的代码:
知道我做错了什么吗?一般来说,我想了解更多关于替换 ff 和 ffdf 类的方法。有什么建议可以让我找到有关该主题的一些示例吗?
r - 删除行ff包
一段时间以来,我一直在使用 ff 包来处理大数据。我使用过的 R 对象有大约 130.000.000 行和 14 列。其中两列温度和降水缺少值“NA”,因此我需要删除这些行才能继续我的工作。我一直在尝试像在普通 R 对象中那样做:
但我不断收到错误消息:
有没有人能够删除 ffdf 对象中的行?我会很感激任何帮助。
r - ff 包写入错误
我正在尝试使用 R 处理 1909x139352 数据集。由于我的计算机只有 2GB 的 RAM,因此数据集对于传统方法来说太大(500MB)。所以我决定使用这个ff
包。但是,我遇到了一些麻烦。该函数read.table.ffdf
无法读取第一块数据。它崩溃并出现下一个错误:
有谁知道发生了什么?
r - R ff 包 ffsave 'zip' 未找到
可重现的例子:
系统:Windows 7 64 位,R 15.2 64 位
已安装 Rtools
zip 300xn-x64 和 unzip 600xn 文件夹已设置为 windows 路径
cmd 行工作,键入 zip 或解压缩它显示功能信息
需要帮忙!任何建议表示赞赏。
r - 如何在 R 中执行大型数据集的完全外连接?
我正在尝试在 R 中对一组中型数据集进行数据分析。我需要做的一项分析要求我对大约 24-48 个文件进行完全外部连接,每个文件有大约 60 列和多达 450,000 行。所以我经常遇到内存问题。
我认为 ffbase 或 sqldf 会有所帮助,但显然它们中的任何一个都不可能完全外连接。
有解决方法吗?我还没有找到的包裹?
r - R中的ffdfdply,拆分和内存限制
我在使用 ff/ffdf 和 ffdfdply 函数时遇到“错误:无法分配大小为 ...MB 的向量”问题。
我正在尝试使用 ff 和 ffdf 包来处理已键入组的大量数据。数据(ffdf 表格格式)如下所示:
唯一键是使用以下内容创建的:
通过使用 key 变量进行分组来总结,我有这个命令:
使用 data.table 出色的分组功能(取自本次讨论的想法)。在实际代码中,有更多函数可应用于 Amount 变量,但即使这样,我也无法处理完整的 ffdf 表(表的较小子集可以正常工作)。
似乎 ffdfdplyis 使用了大量的内存,给出:
BATCHBYTES 似乎也没有帮助。任何有 ffdffply 经验的人都可以推荐任何其他方法来解决这个问题,而无需将 ffdf 表预先拆分成块?
r - 使用 load.ffdf 将 ff / ffbase 文件加载到 R 会话中
我有一个ffdf
保存到磁盘的大型数据框,我需要将其加载到新的R
会话中。当我load.ffdf
在文件所在的目录中运行时,我收到以下错误消息:
我真的很想阅读这些文件。有没有办法鼓励他们被阅读?有没有办法直接读取各个ff
列文件?它们是什么格式的?也许我可以将它们手动放置在底层ff
包使用的临时位置?
我已经浏览了save.ffdf
andload.ffdf
函数,但这并没有给我任何简单的修复。
背景:我最初将数据框保存custTrans
到默认./ffdb
目录。我实际上希望它们在目录中./custTrans
,所以我曾经move.ffdf
移动文件。列文件被移动,但.RData
和.Rprofile
文件没有被移动。我试图从./ffdb
目录加载数据,.RData
并将.Rprofile
文件复制到./custTrans
目录并在load.ffdf
那里运行。我还尝试将数据文件移回./ffdb
目录。错误信息是一样的。
r - 如何按日期对 R 中的大数据框(ffdf)进行子集化?
我正在尝试按日期对 FFDF 进行子集化。下面,我已经使用普通数据框成功创建了这样一个子集。但是我需要一些帮助才能将其应用于 FFDF。我的尝试以及错误消息都列在代码注释中。提前谢谢了!
r - 如何将 ffdf 转换为 ff
我正在使用包中的read.table.ffdf
函数ff
来读取一个巨大的数字矩阵。然后如何在不首先转换为 RAM的情况下将此生成ffdf
的对象转换为对象?ff
r - 具有多个不同键的叉积的 R 包 ff 失败
在尝试创建多个不同键的交叉产品时,我在使用 ff 包时遇到了困难。使用 expand.ffgrid(),在传递单个 ff 对象时没有问题,如下所示:
test_ff <- expand.ffgrid(a=ff(c(0,1,2)), b=ff(c(0,1))) #-- Runs fine
但是,为了在我不知道传入的 ff 对象数量的环境中进行生产,我想将这些对象作为列表传递,如下所示
test_ff <- expand.ffgrid(list(a=ff(c(0,1,2)), b=ff(c(0,1)))) #-- This fails
该文档暗示(不是很清楚)这应该是可能的,并且此语法使用 expand.grid() 可以正常工作。这个功能还没有在 ff 中实现还是我遗漏了什么?
我最初的问题是在多个数据帧上创建一个完整的外部连接——这在 ff 中并不容易(或不可能?)真的让我头疼!