问题标签 [ff]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用 FFDF,按月线性分配金额
这是按月线性分配金额的后续问题。
首先,非常感谢 Señor O、Michele 和 G. Grothendieck 对最初问题的帮助。
现在,我的问题。请考虑以下 FFDF:
我想做和以前一样的事情,按日历月线性拆分金额。但这次使用的是 FFDF 数据结构。
最初的答案是,使用 Map 将自定义爆炸函数的输出“吐出”到 rbind 调用中,然后进行聚合,这被证明是一种非常好的学习体验。确实花了两天时间才真正弄清楚该解决方案是如何工作的,但我最终到达了那里,并做了我所追求的。
然而,在将这种学习应用于真实数据集时,我遇到了内存问题,于是我发现了 ff 包,这非常有用。
为了尝试对 ffdfs 做同样的事情,我尝试使用 ffdfdply,但发现自己非常迷茫,我正在向 SO 寻求一些指导。
非常感谢!
r - 如何按日期对 R 中的大数据框(ffdf)进行子集化?
我正在尝试按日期对 FFDF 进行子集化。下面,我已经使用普通数据框成功创建了这样一个子集。但是我需要一些帮助才能将其应用于 FFDF。我的尝试以及错误消息都列在代码注释中。提前谢谢了!
r - 如何将 ffdf 转换为 ff
我正在使用包中的read.table.ffdf
函数ff
来读取一个巨大的数字矩阵。然后如何在不首先转换为 RAM的情况下将此生成ffdf
的对象转换为对象?ff
r - 如何与ff对象进行矩阵乘法
假设我有ff_matrix
(也不适用于ffdf
)名为x
and的对象y
。x
是一个 100*10 的矩阵,y
是一个 10*1 的矩阵。
但是,x %*% y
会导致Error in x %*% y : requires numeric/complex matrix/vector arguments
.
linux - 如何使用 ff 包加载大 csv?
我是 R 的新手。我有一个大约 2.5 GB 的大 csv,有 3 列和 4000 万行。该列的数据类型是整数、日期时间和字符。如何使用 ff 包加载这个 csv?
r - How to column bind two ffdf
Suppose two ffdf
files:
How can I column bind these without loading them into memory? cbind
doesn't work.
There is the same question http://stackoverflow.com/questions/18355686/columnbind-ff-data-frames-in-r
but it does not have an MWE and the author abandoned it so I reposted.
r - 将 ff 对象转换为 data.frame
我正在使用大矩阵和 ff 包。我正在加载一个 ff 对象,我想用它来计算 crps(分数)。
例如,我有一个 ff_matrix(称为 Mat,有 25 行和 7303 列),它是降水预报(7303 代表天数(大约 20 年),25 是一天的 25 次降水模拟)。我还有一个 ff_array,其中包含这 20 年的观察结果(称为 Obs 和 7303 值)。
使用包 ensembleBMA 我想计算 CRPS。我需要将我的 ff_matrix 和我的 ff_array 放在一个“ensembleBMA”对象中(实际上这是一个 data.frame)。
对于此代码:
我有这个错误:
我尝试了不同的选项,例如:
我总是有这些错误:
或者
有人有想法吗?
r - 在 R 中保存大数据文件,然后在 Matlab 中加载
我在 R 中创建了一个 300000 x 7 数字矩阵,我想在 R 和 Matlab 中使用它。但是,我无法为 Matlab 创建一个可读性好的文件。当使用命令 save() 时,file=xx.csv,它会识别 5 列;扩展名为 .txt 的所有数据都在单个列中打开。我也尝试使用包 ff 和 ffdf 来管理这个大数据(我猜 R 在保存时识别行和列的问题与此有关),但我不知道如何将它保存为 Matlab 的可读格式然后。
该数据集的一个示例是:
output <- matrix(runif(2100000, 1, 1000), ncol=7, nrow=300000)
r - 使用 FF 包在 R 中创建和重塑大数据的函数
我是 R 和 FF 包的新手,我试图更好地了解 FF 如何允许用户使用大型数据集(>4Gb)。我花了相当多的时间在网上搜索教程,但我能找到的那些通常都超出了我的想象。
我通过做学得最好,所以作为练习,我想知道如何使用任意值创建一个长格式的时间序列数据集,类似于 R 的内置“Indometh”数据集。然后我想把它重塑成宽幅。然后我想将输出保存为 csv 文件。
对于小型数据集,这很简单,可以使用以下脚本来实现:
但我想学习为大约 10 Gb 的文件大小执行此操作。我将如何使用 FF 包做到这一点?提前致谢。
r - 使用ff包导入文本文件
我有一个包含 450 万行和 90 列的文本文件要导入到 R 中。使用时read.table
我收到cannot allocate vector of size...
错误消息,因此我尝试使用 ff 包导入,然后再对数据进行子集化以提取我感兴趣的观察结果(有关更多详细信息,请参阅我以前的问题:将选择条件添加到 read.table)。
所以,我使用下面的代码来导入:
但这会返回以下错误消息:
我究竟做错了什么?
以下是文本文件的前 5 行: