1

我在 3 个条件下进行了实验。数据目前的组织方式如下:

| X | Y | Z |
|   | 1 |   |
|   | 0 |   |
| 0 |   |   |
| 0 |   |   |
|   |   | 1 |
|   |   | 1 |

我希望它看起来像这样:

| Y | 1 |
| Y | 0 |
| X | 0 |
| X | 0 |
| Z | 1 |
| Z | 1 |

这是因为似乎很多分析都需要这种格式。

我希望可能有一个函数可以进行这种转换,因为它似乎很常见。

编辑:

我尝试使用下面的重塑建议,但遇到了问题。它似乎没有影响结构。我的数据必须以某种方式与构建的测试数据不同,但我不确定如何。

我在这方面遇到了一些麻烦,我想也许你可以帮忙。

> simpleGame
   Q6.4 Q7.4 Q8.4
3               2
5               2
8          1     
11              2
13         1     
14    2          
16              1
17         1     
19    2          
23    2          
24              1
26    2          
28    2    

但是当我运行融化时,它似乎并没有改变任何东西:

> na.omit(melt(simpleGame))
Using Q6.4, Q7.4, Q8.4 as id variables
   Q6.4 Q7.4 Q8.4
1               2
2               2
3          1     
4               2
5          1     
6     2          
7               1
8          1     
9     2          
10    2          
11              1
12    2          
13    2   

任何建议将不胜感激。

Edit2:根据要求,这是数据框的 dput:

> dput(simpleGame)
structure(list(Q6.4 = structure(c(1L, 1L, 1L, 1L, 1L, 3L, 1L, 
1L, 3L, 3L, 1L, 3L, 3L), .Label = c("", "1", "2", "Which do you choose?"
), class = "factor"), Q7.4 = structure(c(1L, 1L, 2L, 1L, 2L, 
1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L), .Label = c("", "1", "2", "Which do you choose?"
), class = "factor"), Q8.4 = structure(c(3L, 3L, 1L, 3L, 1L, 
1L, 2L, 1L, 1L, 1L, 2L, 1L, 1L), .Label = c("", "1", "2", "Which do you choose?"
), class = "factor")), .Names = c("Q6.4", "Q7.4", "Q8.4"), row.names = c(3L, 
5L, 8L, 11L, 13L, 14L, 16L, 17L, 19L, 23L, 24L, 26L, 28L), class = "data.frame")

我在想也许这与这些实际上是因素有关?我不知道如何将整个 data.frame 强制转换为数字,但我想也许可以做到。

4

2 回答 2

5

如果您的数据如下:

df <- structure(list(X = c(NA, NA, 0, 0, NA, NA), Y = c(1, 0, NA, NA, 
      NA, NA), Z = c(NA, NA, NA, NA, 1, 1)), .Names = c("X", "Y", "Z"
      ), class = "data.frame", row.names = c(NA, -6L))

试试这个:

na.omit(stack(df))
#    values ind
# 3       0   X
# 4       0   X
# 7       1   Y
# 8       0   Y
# 17      1   Z
# 18      1   Z

如果您想要您的订单:

na.omit(stack(df[c(2,1,3)]))[c(2,1)]
#    ind values
# 1    Y      1
# 2    Y      0
# 9    X      0
# 10   X      0
# 17   Z      1
# 18   Z      1
于 2013-03-13T15:16:19.333 回答
4

使用reshape2和@Arun 数据结构:

na.omit(melt(df))
Using  as id variables
   variable value
3         X     0
4         X     0
7         Y     1
8         Y     0
17        Z     1
18        Z     1

使用 OP 结构进行编辑

dat.m <- melt(dat,measure.vars = c('Q6.4','Q7.4','Q8.4'))
dat.m[!(dat.m$value == ''),]

解释:您的所有列都是因子。的默认行为melt是将因子列作为 id。作为一种解决方法,我告诉融化它们是可测量的变量,因此melt将行名作为 id。对于第二部分,我只是替换na.omit为,!(dat.m$value == '')因为值内没有 NA,我只有空字符。

于 2013-03-13T15:23:54.423 回答