17

我正在尝试从循环写入 R 中的数据帧,例如这样的循环>

for (i in 1:20) {
print(c(i+i,i*i,i/1))}

并将每行 3 个值写入具有三列的数据框,以便每次迭代都采用新行。我试过使用矩阵,ncol=3 并按行填充,但只从循环中获取最后一项。

谢谢。

4

4 回答 4

24

你可以使用 rbind:

d <- data.frame()
for (i in 1:20) {d <- rbind(d,c(i+i, i*i, i/1))}
于 2010-04-01T22:14:54.587 回答
10

另一种方法是

do.call("rbind", sapply(1:20, FUN = function(i) c(i+i,i*i,i/1), simplify = FALSE))


     [,1] [,2] [,3]
 [1,]    2    1    1
 [2,]    4    4    2
 [3,]    6    9    3
 [4,]    8   16    4
 [5,]   10   25    5
 [6,]   12   36    6

如果不指定simplify = FALSE,则必须使用 转置结果t。这对于大型结构来说可能很乏味。

如果您有一个较大的数据集和/或您需要多次重复此操作,则此解决方案特别方便。

我在这个“线程”中提供了一些解决方案的时间安排。

> system.time(do.call("rbind", sapply(1:20000, FUN = function(i) c(i+i,i*i,i/1), simplify = FALSE)))
   user  system elapsed 
   0.05    0.00    0.05 

> system.time(ldply(1:20000, function(i)c(i+i, i*i, i/1)))
   user  system elapsed 
   0.14    0.00    0.14 

> system.time({d <- matrix(nrow=20000, ncol=3) 
+ for (i in 1:20000) { d[i,] <- c(i+i, i*i, i/1)}})
   user  system elapsed 
   0.10    0.00    0.09 

> system.time(ldply(1:20000, function(i)c(i+i, i*i, i/1)))
   user  system elapsed 
  62.88    0.00   62.99 
于 2012-06-29T09:31:20.537 回答
6

For循环有副作用,所以通常的做法是在循环之前创建一个空数据框,然后在每次迭代时添加到它。您可以将其实例化为正确的大小,然后i在每次迭代时将您的值分配给第 ' 行,或者添加到它并使用rbind().

对于大型数据集,前一种方法将具有更好的性能。

于 2010-04-01T22:17:32.640 回答
6

如果您的所有值都具有相同的类型并且您知道行数,则可以通过以下方式使用矩阵(这将非常快):

d <- matrix(nrow=20, ncol=3) 
for (i in 1:20) { d[i,] <- c(i+i, i*i, i/1)}

如果您需要一个数据框,您可以使用 rbind (正如另一个答案所建议的那样),或者包 plyr 中的函数,如下所示:

library(plyr)
ldply(1:20, function(i)c(i+i, i*i, i/1))
于 2012-06-29T07:47:20.103 回答