我正在尝试从循环写入 R 中的数据帧,例如这样的循环>
for (i in 1:20) {
print(c(i+i,i*i,i/1))}
并将每行 3 个值写入具有三列的数据框,以便每次迭代都采用新行。我试过使用矩阵,ncol=3 并按行填充,但只从循环中获取最后一项。
谢谢。
你可以使用 rbind:
d <- data.frame()
for (i in 1:20) {d <- rbind(d,c(i+i, i*i, i/1))}
另一种方法是
do.call("rbind", sapply(1:20, FUN = function(i) c(i+i,i*i,i/1), simplify = FALSE))
[,1] [,2] [,3]
[1,] 2 1 1
[2,] 4 4 2
[3,] 6 9 3
[4,] 8 16 4
[5,] 10 25 5
[6,] 12 36 6
如果不指定simplify = FALSE
,则必须使用 转置结果t
。这对于大型结构来说可能很乏味。
如果您有一个较大的数据集和/或您需要多次重复此操作,则此解决方案特别方便。
我在这个“线程”中提供了一些解决方案的时间安排。
> system.time(do.call("rbind", sapply(1:20000, FUN = function(i) c(i+i,i*i,i/1), simplify = FALSE)))
user system elapsed
0.05 0.00 0.05
> system.time(ldply(1:20000, function(i)c(i+i, i*i, i/1)))
user system elapsed
0.14 0.00 0.14
> system.time({d <- matrix(nrow=20000, ncol=3)
+ for (i in 1:20000) { d[i,] <- c(i+i, i*i, i/1)}})
user system elapsed
0.10 0.00 0.09
> system.time(ldply(1:20000, function(i)c(i+i, i*i, i/1)))
user system elapsed
62.88 0.00 62.99
For
循环有副作用,所以通常的做法是在循环之前创建一个空数据框,然后在每次迭代时添加到它。您可以将其实例化为正确的大小,然后i
在每次迭代时将您的值分配给第 ' 行,或者添加到它并使用rbind()
.
对于大型数据集,前一种方法将具有更好的性能。
如果您的所有值都具有相同的类型并且您知道行数,则可以通过以下方式使用矩阵(这将非常快):
d <- matrix(nrow=20, ncol=3)
for (i in 1:20) { d[i,] <- c(i+i, i*i, i/1)}
如果您需要一个数据框,您可以使用 rbind (正如另一个答案所建议的那样),或者包 plyr 中的函数,如下所示:
library(plyr)
ldply(1:20, function(i)c(i+i, i*i, i/1))