假设我们有一个 data.frame :
> df <- data.frame(A = c('a','a','b','c','c','b','a'), B = c('d','e','e','e','f','f','g'))
在打印我们将得到的值时:
> df
A B
1 a d
2 a e
3 b e
4 c e
5 c f
6 b f
7 a g
在应用model.matrix
时,它给出:
> d <- model.matrix(~.,df)
> d
(Intercept) Ab Ac Be Bf Bg
1 1 0 0 0 0 0
2 1 0 0 1 0 0
3 1 1 0 1 0 0
4 1 0 1 1 0 0
5 1 0 1 0 1 0
6 1 1 0 0 1 0
7 1 0 0 0 0 1
现在,正如我们在 factor 中看到的那样df$A
,有3 个唯一字符,即 (a, b, c)。但是,在其等效的model.matrix中,我们有Ab
, Ac
。同样,在 的情况下df$B
,Bd
缺少。
所以,我的问题是,如果我忽略了?model.matrix
Intercept