4

我在 R 中有以下数据框

  LOCATION COLOR  STATE
1 A        green  fresh
2 A        red    rotten
3 B        green  fresh
4 B        green  fresh
5 C        red    fresh
6 C        green  rotten

可以使用以下脚本在 R 中创建上述数据框

dat <- read.table(text = "LOCATION COLOR STATE
1 A green fresh
2 A red rotten
3 B green fresh
4 B green fresh
5 C red fresh
6 C green rotten",header = TRUE,sep = "",row.names = 1)

我正在尝试重新排列我的数据框以获得以下输出

  LOCATION COLOR ROTTEN FRESH
1 A        red    1      0
2 A        green  0      1
3 B        red    0      0
4 B        green  0      2
5 C        red    0      1
6 C        greed  1      0

我正在尝试使用以下代码执行此操作

dat <- as.data.frame(unclass(xtabs(~ LOCATION  + COLOR + STATE,dat)))

这给了我

            green.fresh   red.fresh  green.rotten red.rotten
1  A            1           0            0          1
2  B            2           0            0          0
3  C            0           1            1          0

如您所见,我非常接近所需的格式,但我不确定如何使当前的输出与所需的输出相匹配。任何想法或提示将不胜感激。

4

3 回答 3

6

我确信有一种方法可以做到这一点,xtabs但我倾向于使用dcast

library(reshape2)
dcast(dat,LOCATION+COLOR~STATE,
      fun.aggregate = length,value.var = "STATE",drop = FALSE)
  LOCATION COLOR fresh rotten
1        A green     1      0
2        A   red     0      1
3        B green     2      0
4        B   red     0      0
5        C green     0      1
6        C   red     1      0

更新为包括所需输出中所示的缺失变量组合。

于 2012-11-29T17:00:25.623 回答
2

我猜想,效率比@joran的解决方案低得多——当然可读性要低得多(但在“事情就是这样工作”的方式中仍然很有趣)如果你想从xtabs到一个data.frame

temp <- xtabs(~ LOCATION  + COLOR + STATE, dat)
data.frame(expand.grid(rev(attr(ftable(temp), "row.vars"))),
           setNames(as.data.frame.matrix(ftable(temp)), 
                    rev(attr(ftable(temp), "col.vars")$STATE)))
#   COLOR LOCATION rotten fresh
# 1 green        A      1     0
# 2   red        A      0     1
# 3 green        B      2     0
# 4   red        B      0     0
# 5 green        C      0     1
# 6   red        C      1     0

哎哟。

于 2012-11-29T18:57:11.190 回答
1
aggregate(cbind(FRESH,ROTTEN)~LOCATION+COLOR,
  data=transform(dat,FRESH=1L*(STATE=="fresh"),ROTTEN=1L*(STATE=="rotten")),
  FUN=sum)


  LOCATION COLOR FRESH ROTTEN
1        A green     1      0
2        B green     2      0
3        C green     0      1
4        A   red     0      1
5        C   red     1      0
于 2012-11-29T20:31:25.683 回答