4

感谢我从阅读资料中获得的所有帮助。

当我只处理一个 data.frame 时,我对我的 R 循环不满意,因为我必须一遍又一遍地写下数据帧的名称,这会使我的 R 代码膨胀。

这是一个愚蠢的例子:

x<- rep(NA,10)
y <- 1:10
dat <- data.frame(x,y)

for(i in 2:nrow(dat)){
    dat$x[i] <- dat$y[i] + dat$y[i-1]
}

所以我想摆脱的是那个dat$-bit。外部循环可以很好地完成within(),但我不确定你是否真的可以用 R 做到这一点。我试过了:

remove(x,y) # In order to avoid accidental usage of the initial vectors
within(dat,{
for(i in 2:nrow(dat)){
    x[i] <- y[i] + y[i-1]
}})

输出如下所示:

    x  y  i
1  NA  1 10
2   3  2 10
3   5  3 10
4   7  4 10
5   9  5 10
6  11  6 10
7  13  7 10
8  15  8 10
9  17  9 10
10 19 10 10

所以循环确实有效,只是有一个新的神奇列。

有谁知道(1)这里发生了什么以及(2)如何优雅地处理这种循环(一个更复杂的例子within()围绕一个循环,包括几个if()语句和计算失败顺便说一句?

提前非常感谢!skr

4

1 回答 1

4

本回答了您的主要问题,并指出这i是由for循环分配的。您可以通过尝试这样的事情来看到情况如此:

for(j in 1:3) cat("hi\n") 
hi
hi
hi
> j
[1] 3

一种选择是i通过设置它的值来删除不需要的变量NULL

within(dat,{
for(i in 2:nrow(dat)){
    x[i] <- y[i] + y[i-1]
}
i <- NULL
})

另一种是使用with()而不是within()

dat$x <- with(dat, {
    for(i in 2:nrow(dat)){
        x[i] <- y[i] + y[i-1]
    }
    x
})

最后,虽然我意识到你的只是一个玩具示例,但最好的解决方案通常是完全避免for循环:

d <- data.frame(y=1:10)
within(d, {x = y + c(NA, head(y, -1))})
#     y  x
# 1   1 NA
# 2   2  3
# 3   3  5
# 4   4  7
# 5   5  9
# 6   6 11
# 7   7 13
# 8   8 15
# 9   9 17
# 10 10 19
于 2012-09-26T20:37:29.030 回答