1

假设我有以下data.frame:

df=data.frame(cat=c("a","b","c"),y=c(1,2,3))

model.matrix类别 (cat) 转换为虚拟变量,如下所示:

model.matrix(~0+cat,df)


 cata catb catc
1    1    0    0
2    0    1    0
3    0    0    1
attr(,"assign")
[1] 1 1 1
attr(,"contrasts")
attr(,"contrasts")$cat
[1] "contr.treatment"

但是,我希望将这些虚拟变量分配给 df$y 中的值。我能想到的一种可能的解决方案是与 y 相乘。

但是,我猜有更好的专用功能吗?

所以基本上,将虚拟变量转换为给定向量的最有效方法是什么?

4

1 回答 1

3

也许我们可以试试

library(reshape2)
acast(df, cat~y, value.var="y", fill=0)
#  1 2 3
#a 1 0 0
#b 0 2 0
#c 0 0 3

或使用model.matrix

model.matrix(~0 + cat, df) *df$y
于 2016-01-14T05:30:29.723 回答