63

我有这样的巨大数据框:

SN = c(1:100, 1:100, 1:100, 1:100)  
class = c(rep("A1", 100), rep("B2", 100), rep("C3", 100), rep("D4", 100)) # total 6000 levels 
myvar = rnorm(400)
mydf = data.frame(SN, class, myvar) 

我想“解开”到一个表,每个级别作为单列并填充 myvar:

SN          A1            B2          C3         D4       .............and so on for all 6000 

我怎样才能做到这一点,我知道这是一个简单的问题,但我想不通。

4

4 回答 4

63
> dcast(mydf, SN ~ class)

  SN         A1         B2          C3          D4
1  1  0.1461258  0.8325014  0.33562088 -0.07294576
2  2  0.5964182  0.4593710 -0.23652803 -1.52539568
3  3  2.0247742 -1.1235963  1.79875447 -1.87462227
4  4  0.8184004  1.3486721  0.76076486 -1.18311991
5  5 -0.6577212  0.3666741 -0.06057506  1.38825487
6  6  0.1590443  0.2043661  0.08161778  0.10421797
...
于 2011-10-19T20:55:05.093 回答
7
molten = melt( mydf , id.vars = c( "SN" , "class" ) , measure.vars = "myvar" )
casted = dcast( molten , SN~class )
于 2011-10-19T20:59:07.277 回答
2

另一种方法split

mydfSplit <- split(mydf[,-2], mydf$class, drop=TRUE)

data.frame结果是一个列表,如果组件具有相同的尺寸(在此示例中是正确的),则可以轻松地将其转换为 a :

mydf2 <- do.call(cbind, mydfSplit)

这个解决方案的问题是最终结果的名称需要清理。SN但是,对于更一般的数据,如果每个类都不同,这可能很有用。

于 2011-10-20T09:59:17.900 回答
1

在base R中,你可以这样做......

# get it sorted so that all you need to do is make a matrix out of it
mydf <- mydf[order(mydf$class, mydf$SN),]
# save the unique values of SN
SNu <- unique(mydf$SN)
# combine a matrix with SN
mydfw <- data.frame(SNu, matrix(mydf$myvar, nrow = length(SNu)))
# name your columns    
colnames(mydfw) <- c('SN', levels(mydf$class))

或者,对于使用聚合的更简洁的表达式

aggregate(myvar~SN, mydf, 'c')
# column names don't come out great
colnames(mydfw) <- c('SN', levels(mydf$class))
于 2011-10-19T22:18:02.293 回答