3

我是 R 的新手(来自 Stata 世界)。为了节省自己的时间,我尝试使用循环函数来生成数据框中现有数据列的幂(大约 70,000 行长)。现有列称为 OrdersData$timecount;我正在尝试自动生成 9 次幂,即 OrdersData$timecount2=OrdersData$timecount^2、OrdersData$timecount3=OrdersData$timecount^3 等等。我正在尝试在一个命令中完成所有操作:

i<-1;
for(i in 1:9){paste(OrdersData$timecount,"[i+1]",sep="")<-OrdersData$timecount^[i+1]}

我收到一个名为“文本”的错误。我究竟做错了什么?

4

2 回答 2

3

你需要停止思考stata并使用R成语。

这是一种有效的方法(并且会阻止您思考stata

  DF <- data.frame(timeCount = seq(0,1,l=3))
  # use lapply to create a list
  # with elements timeCount^1, timeCount^2, .... etc
  powered <- lapply(1:9, function(x,y) x^y, x = DF$timeCount)
  # give names that make sense
  names(powered) <-  paste0('timeCount',1:9)
  # convert to a data.frame
  newDF <-  as.data.frame(powered)

  newDF



  timeCount1 timeCount2 timeCount3 timeCount4 timeCount5 timeCount6 timeCount7 timeCount8  timeCount9
1        0.0       0.00      0.000     0.0000    0.00000   0.000000  0.0000000 0.00000000 0.000000000
2        0.5       0.25      0.125     0.0625    0.03125   0.015625  0.0078125 0.00390625 0.001953125
3        1.0       1.00      1.000     1.0000    1.00000   1.000000  1.0000000 1.00000000 1.000000000

@Brandon 的答案可能更容易理解,但在循环中增长 data.frame 将每次至少复制一次 data.frame (内部)。

于 2012-10-30T03:43:50.787 回答
2

您的错误来自将<-变量分配给字符串(不是变量)。您可以使用该assign命令“创建”变量。查看?assign?get(鉴于您目前的尝试,阅读两者的宝贵学习经验)

但是您可以使用与您尝试创建的大部分内容相匹配的 for 循环。

for(i in 1:9) {
OrdersData[paste("timecount",i+1,sep="")] <- OrdersData$timecount^i
}

有时思考比打字需要更长的时间:

OrdersData$timecount2 <- OrdersData$timecount^2
OrdersData$timecount3 <- OrdersData$timecount^3
OrdersData$timecount4 <- OrdersData$timecount^4
OrdersData$timecount5 <- OrdersData$timecount^5
OrdersData$timecount6 <- OrdersData$timecount^6
OrdersData$timecount7 <- OrdersData$timecount^7
OrdersData$timecount8 <- OrdersData$timecount^8
OrdersData$timecount9 <- OrdersData$timecount^9
于 2012-10-30T03:43:12.280 回答