2

我的问题与这个问题有些相关。

我有如下数据

V1   V2
..   1
..   2
..   1
..   3

我需要累计计算V1每个值的数据方差V2(这意味着对于一个特定的值,V2比如说n,所有V1对应V2小于的行都n需要包括在内。

ddply在这种情况下会有所帮助吗?

4

1 回答 1

4

我认为ddply不会有帮助,因为它是建立在采用数据框的非重叠子集的概念之上的。

d <- data.frame(V1=runif(1000),V2=sample(1:10,size=1000,replace=TRUE))
u <- sort(unique(d$V2))
ans <- sapply(u,function(x) {
    with(d,var(V1[V2<=x]))
})
names(ans) <- u

我不知道是否有更有效的方法来做到这一点......

于 2012-09-16T13:24:09.200 回答