问题标签 [ffbase]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1314 浏览

r - 如何将ff向量更改为法线向量R

我有一个接受向量作为输入的函数。

我有一个ffdfnamed X,并且想使用数据列作为函数输入的向量。

要将名为“Mag”的数据列作为向量,我将使用以下内容:

但是,ff我相信这是一个向量,并且该函数只会接受法线向量,我该如何将其更改回法线向量?

我想我只需要使用物理组件,但我不知道如何编码。

提前致谢。

0 投票
1 回答
96 浏览

r - R ffbase 合并问题

当我将合并与 ffdf 一起使用时,我看到了一些奇怪的行为,我想知道是否有人可以向我解释为什么会发生这种情况以及如何解决它。

这是常规数据框的示例:

这是ffdf的代码:

我期待第一个案例,但我得到了第二个案例。我感谢任何关于此事的帮助。

0 投票
1 回答
723 浏览

r - 在循环中设置 ffdf

我正在尝试使用 ffbase 在循环中对一个非常大的 ffdf 对象进行子集化,但我收到了错误消息:

我在具有大量可用内存的 ssh 上运行此代码。这是我要运行的代码:

我试图实施 jwijffels 在这个问题的评论中建议的修复,但无济于事。提前致谢!

0 投票
0 回答
728 浏览

r - R ffdfappend SIGBUS 错误

我有一个使用ffbaseandff包的 R 脚本。在 Windows 中,脚本运行良好。在 Linux 中(不同的机器,虽然 RAM 更高)它会因总线 (SIGBUS) 错误而崩溃。

Windows(版本 6.1.7601)会话信息:

  1. R 版本 3.1.0 (2014-04-10)
  2. 平台:x86_64-w64-mingw32/x64(64位)
  3. 附包:ffbase_0.11.3 ff_2.2-13 bit_1.1-12

Linux(Linux xenja 3.5.0-54-generic #81~precise1-Ubuntu SMP Tue Jul 15 04:02:22 UTC 2014 x86_64 x86_64 x86_64 GNU/Linux)会话信息:

  1. R 版本 3.1.1 (2014-07-10)
  2. 平台:x86_64-pc-linux-gnu(64位)
  3. 附包:ffbase_0.11.3 ff_2.2-13 bit_1.1-12

R 脚本崩溃的点位于循环中,循环重复读取不同的文件内容并通过函数将它们连接到ff数据帧中。ffdfappend循环如下:

当我在 Linux 中运行 R 脚本时,在标准错误中写入以下内容(我故意用@@@截断了很长的行)

当我将 R 脚本附加到 时gdb,我在崩溃时收到以下相关消息:

gdb 回溯:

当我运行 R 脚本时,strace我在崩溃点得到以下相关信息:

任何有关如何进行的建议表示赞赏。

非常感谢您的宝贵时间。

-乔治。

0 投票
1 回答
584 浏览

r - 将多个 CSV 文件中的数据读取到单个 ffdf 对象中

是否可以将多个文件中的数据一次加载到 ff 数据帧 (ffdf) 中?可以说我有

我知道我可以将每个 csv 文件加载到一个单独的 ffdf 对象中,然后将它们 ffdfrbind.fill 在一起。但这似乎是一种低效的方式,加载两次。有没有更直接的方法?

0 投票
2 回答
860 浏览

r - 如何在ff或ffbase中将因子向量转换为POSIXct

用 读入大型数据集后read.csv.ffdf,其中一列是时间。例如2014-10-18 00:01:02,对于该列中的 100 万行。该列是一个因素。如何将其转换为POSIXct受支持ff?只需使用as.POSIXct()将值转换为NA

或者当我一开始读入数据集时,我可以将该列指定为POSIXct吗?

我的目标是获得月份和日期(甚至小时)。因此,除了转换为POSIXct.

例如,我们有 9 x 2 表,

两列是 ID(数值类)和时间(因子类)

这是输入

0 投票
1 回答
676 浏览

r - 为ff中的变量赋值

由于数据库的大小,我正在使用 ff 数据集(final_faf_data)。我正在尝试创建一个新变量 dpy,它对于所有行只有一个值(365)。当我尝试以下 cmd 时(类似于我在数据框中所做的)

我收到以下错误

所以我的问题是如何分配它?我试过

但它给出“NULL”

任何见解将不胜感激。

TIA,克里希南

0 投票
1 回答
330 浏览

r - 在 R 中重塑 ffdf 数据框

我正在使用dcast函数来 rshape 中的 datframe R,但同时使用大型数据框。我将其转换为ffdf dataframe无法使用的dcast功能,如果有其他选择,请帮助我。找到我用于小型数据框的以下示例以及我想要做什么ffdf dataframe

这是有效的,但是:

这给了我错误请帮助

在此先感谢 pavan kancharala

0 投票
2 回答
100 浏览

r - ff 日期向量的重复函数失败

您好我正在尝试使用 ffbase 包的重复函数和以下代码从包含日期的 ff 向量中删除重复项:

但是我收到以下错误:

有没有办法解决这个问题而不必先将 v2 向量强制为 ram 对象?

0 投票
0 回答
387 浏览

r - 如何删除(或选择)ff矩阵的指定行或列,或子集ff矩阵?

一个 300,000 行和 1000 列的 ff 矩阵:

我想删除矩阵的最后一行使用命令:

但是,我得到了错误:“can not allocate vector of size 1.1 Gb”,似乎x[-300000,]不再返回ff对象,而是直接存储在所有的内存中。所以我有两个问题:

  1. 如何删除矩阵 x in 的第 i 行(或列),然后仍然返回 ff 对象。
  2. 如何选择第j列等于100(整数)的行或子集,然后仍然返回ff对象。

也许功能ffwhich和包可以帮助我subset.ffff但我不明白如何使用它们。