0 投票

2 回答

6877 浏览

r - R data.table rbindlist

我在使用包含 30 列左右的合理大小的 data.table 时遇到问题：（注意我在下面使用虚拟值）

使用rbindlist(list(dat, dat2))添加具有相同字段和另外 50000 行的新 data.table 会产生不正确的新主 data.table。

是否有一种简单快速的解决方案可以将新行添加到列字段都匹配的 data.table 中？

为了简化，我创建了一个虚拟数据集。

使用rbind(dat,dat2)输出重复 dat2。（预计应该是总共 15 行）

我阅读了论坛以寻求更好的解决方案，并提出了一些建议，rbindlist但这看起来也不起作用。与输出相同rbind

有没有一种快速的解决方案可以将 dat2 绑定到 dat 而不重复？

rbind 和 rbindlist 的输出

r data.table rbind

2013-07-24T14:38:15.813

0 投票

2 回答

81 浏览

r - 在 R 中连接数据时如何获得正确类的结果？

我找到了 forc并且rbind结果的类是基于第一个参数的类。这给我带来了一个问题，因为NA作为第一个参数的存在将向量强制Date转换为numeric向量。比较这两个class调用的结果：

同样适用于rbind：

Date无论参数的顺序如何，如何确保这些连接的结果始终是一个向量？

r class concatenation rbind

2013-07-25T10:49:53.230

0 投票

1 回答

1640 浏览

r - R：拆分-应用-组合...通过聚合将函数应用到按类划分的行绑定数据帧子集

更新：我的 NOAA GHCN-Daily 气象站数据功能已被清理并合并到rnoaa包中，可在 CRAN 或此处获取： https ://github.com/ropensci/rnoaa

我正在设计一个 R 函数来计算由多个数据帧组成的数据集的统计数据。简而言之，我想根据包含名称的参考数据框按类提取数据框。然后，我想将统计函数应用于每个给定日期列出的指标的值。实际上，我想调用并覆盖数据框列表，以计算每个唯一日期和度量值的值向量上的函数，其中值不是 NA。

使用“by”函数，基于类变量将数据帧从文件中迭代地读入工作区。导入给定类的文件后，我想 rbind() 该类的数据框和一个年份范围内的每个用户定义的指标。然后，我想将用户提供的统计函数串联应用于与年、月和日的给定值相对应的类中的每个指标（即，7 月 1 日的平均 [函数] 低温 [类]， 1990 [日期] 报告给定区域 [类] 内的所有位置 [数据框]。我希望最终结果是新的数据框，其中包含区域内每个日期的值以及应用的每个指标和统计函数的年份范围。我非常接近使用 aggregate() 函数得到这个结果，但我无法从聚合函数中获得合理的结果，该函数目前为除平均温度以外的大多数函数输出 NA 和 NaN。任何建议将不胜感激！到目前为止，这是我的代码：

我想我已经很接近了，但我不确定 rbind() 是否正常执行，也不确定为什么 aggregate() 函数会为这么多指标输出 NA 和 NaN 。我担心数据框没有绑定在一起，或者某些统计函数没有很好地处理缺失值。提前感谢您提供的任何建议。

干杯，

亚当

r user-defined-functions nested-loops nested-lists rbind

2013-07-26T21:40:56.167

0 投票

4 回答

36214 浏览

r - rbind data.frames 与不同列的有效方法

我有一个包含不同列集的数据框列表。我想将它们按行组合成一个数据框。我习惯plyr::rbind.fill这样做。我正在寻找可以更有效地做到这一点的东西，但与此处给出的答案相似

r data.table rbind

2013-08-01T20:16:34.197

0 投票

1 回答

1138 浏览

r - 如何根据对象名称来绑定矩阵？

我有几个矩阵，我想rbind在一个总结中。它们是不同功能的对象产品，它们的名称具有相同的模式。

我想要做的是告诉 R 查找具有该通用模式的所有对象，然后查找rbind它们。

假设这些矩阵存在：

我尝试了这样的方法来获取它们：

我不知道如何告诉rbind将其用作论据。基本上，我会给出与rbind(commonname.N1, commonname.N2, commonname.M1)本例中相同的矩阵。

我已经尝试过

但这只是创建了一个以不同对象作为名称的矩阵。

此处提出了类似的问题，但是：

不做这项工作。

抱歉，如果我在某处遗漏了一些基本的东西，但我无法弄清楚，而且我对 R 比较陌生。

r rbind

2013-08-08T11:35:37.070

0 投票

1 回答

2138 浏览

r - data.table 的 do.call rbind 取决于 NA 的位置

考虑这个

返回

但

返回

如何在不重新排序列表内容的情况下强制第一个行为？

数据表在 mapreduce 作业中确实更快（在 55 个节点上调用 data.table ~10*3MM 次，数据表比数据帧快很多倍，所以我希望它能够工作......）问候 saptarshi

r data.table rbind do.call

2013-08-27T20:45:38.600

0 投票

1 回答

74 浏览

r - 从 for 循环中按行组合多列

我正在尝试应用该函数embed(x=time series, dimension=n)，它返回原始时间序列 (ts) 和 ts 滞后 n-1 次。我的时间序列 (8) 有 20 年之久，我使用的是 n=5。这是应用embed()到我的一个 ts 后的输出：

我想将此功能应用于我的 8 ts 并按行组合输出。这是我为此编写的函数：

我的函数运行不正常，它返回第一个 ts 的输出（重复 8 次）。我想问题是索引。任何建议将不胜感激。下面是我的数据。谢谢！

数据：

r for-loop indexing time-series rbind

2013-09-02T03:26:34.847

0 投票

3 回答

340 浏览

r - R数据框创建

我在 R 中有一个数据框，比如 f1。我想创建另一个数据框 f2，其中 f1 中的列名（标题）作为 f2 的行名。我知道 f1 中有 300 个名称，并且想将颜色“#ff0000”分配给前 200 个并将颜色“#0000ff”分配给最后 100 个。我该怎么做？结果应该看起来像，

r dataframe rbind cbind

2013-09-04T16:18:03.860

0 投票

0 回答

125 浏览

r - data.table 中的 rbind/rbindlist 错误：强制引入的 NA

我正在使用数据框，我必须将其转换为数据表进行操作。当我尝试rbind()使用 2 个数据表时，我收到以下警告消息

我在这里发现了一个关于这个问题的先前问题，它是 R 中的一个错误

我遇到的问题是我正在处理一个庞大的数据集，我无法注意到新的 NA 值是否被添加到数据框中。（为什么还要添加任何 NA 值？）

我试图通过在绑定数据表之前将它们转换为数据框来解决这个问题。

我不再收到错误消息，但我真的很担心我的数据！是否添加了任何 NA 值？还是我的数据通过这个技巧保持不变？我很高兴继续使用 data.frame 中的数据。

谢谢，

r data.table rbind

2013-09-13T13:54:15.280

0 投票

1 回答

2441 浏览

r - 合并两个动物园对象时，为什么会出现“rbind.zoo(...) 中的错误：索引重叠”？

我有两个看似相同的动物园对象，由不同时间段的 csv 文件中的相同命令创建。我尝试将它们组合成一个长动物园，但由于“索引重叠”错误而失败。（'merge' 'c' 或 'rbind' 都会产生相同错误文本的变体。）据我所知，没有重复，时间段也不重叠。我究竟做错了什么？我在 Windows 7 64 位上使用 R 版本 3.0.1，如果这有影响的话。

更新：在尝试制作可重现的案例时，我得出结论，这是一个实现错误，因为我正在处理大量行：如果最终结果超过 311434 行，则会失败。

我很抱歉，但我没有 R 脚本技能来制作一个临界长度的动物园，希望有人能帮助我..

更新 2-回应 Jason 的建议..：问题出在 MATCH 中，但我的 R 技能不足以知道如何解释它 - 这是否意味着 MATCH 在 xt 中找到重复值而 anyDuplicated 没有？

r merge zoo rbind

2013-09-24T04:12:03.620

问题标签 [rbind]

rbind 和 rbindlist 的输出

Reference