1

我有一个数据框,其中包含一个带有锯齿状条目的列表向量:

df = data.frame(x = rep(c(1,2), 2), y = rep(c("a", "b"), each = 2))

L = list()
for (each in round(runif(4, 1,5))) L = c(L, list(1:each))
df$L = L

例如,

x y          L
1 a          1
2 a 1, 2, 3, 4
1 b    1, 2, 3
2 b    1, 2, 3

我如何创建一个表格来计算每个 x 的 L 值,跨越 y 的值?所以,在这个例子中,它会输出类似的东西,

    1   2   3   4
X
1   2   1   1   0
2   2   2   2   1

我有一些运气使用

tablist = function(L) table(unlist(L))
tapply(df$L, df$x, tablist)

产生,

$`1`

1 2 3 
2 1 1 

$`2`

1 2 3 4 
2 2 2 1 

但是,我不确定如何从这里转到一张桌子。此外,我开始怀疑这种方法可能会开始花费大量时间来处理大型数据帧。任何想法/建议将不胜感激!

4

2 回答 2

2

使用pylr

library(plyr)
df = data.frame(x = rep(c(1,2), 2), y = rep(c("a", "b"), each = 2))

L = list()
set.seed(2)
for (each in round(runif(4, 1,5))) L = c(L, list(1:each))
df$L = L

> df
  x y          L
1 1 a       1, 2
2 2 a 1, 2, 3, 4
3 1 b    1, 2, 3
4 2 b       1, 2

table(ddply(df,.(x),summarize,unlist(L)))
>     table(ddply(df,.(x),summarize,unlist(L)))
   ..1
x   1 2 3 4
  1 2 2 1 0
  2 2 2 1 1
于 2012-07-27T21:52:13.967 回答
1

如果你不喜欢 plyr...

vals <- unique(unlist(df$L))
names(vals) <- vals
do.call("rbind",
    lapply(split(df,df$x),function(byx){
        sapply(vals, function(i){
            sum(unlist(sapply(byx$L,"==",i)))
        })
    })
)
于 2012-07-28T00:06:46.820 回答