1

我想运行一个简单的多元逻辑回归。我在下面用二进制数据做了一个例子来讨论一个例子。

多元回归 = 试图预测 2+ 个结果变量

> y = matrix(c(0,0,0,1,1,1,1,1,1,0,0,0), nrow=6,ncol=2)

> x = matrix(c(1,0,0,0,0,0,1,1,0,0,0,0,1,1,1,0,0,0,1,1,1,1,0,0,1,1,1,1,1,0,1,1,1,1,1,1), nrow=6,ncol=6)
> x
     [,1] [,2] [,3] [,4] [,5] [,6]
[1,]    1    1    1    1    1    1
[2,]    0    1    1    1    1    1
[3,]    0    0    1    1    1    1
[4,]    0    0    0    1    1    1
[5,]    0    0    0    0    1    1
[6,]    0    0    0    0    0    1
> y
     [,1] [,2]
[1,]    0    1
[2,]    0    1
[3,]    0    1
[4,]    1    0
[5,]    1    0
[6,]    1    0

因此,变量“x”有 6 个样本,每个样本有 6 个属性。变量“y”对 6 个样本中的每一个都有 2 个预测。我特别想处理二进制数据。

> fit = glm(y~x-1, family = binomial(logit))

我做“-1”来消除截距系数。其他一切都是多变量情况下的标准逻辑回归。

> fit

Call:  glm(formula = y ~ x - 1, family = binomial(logit))

Coefficients:
 data1   data2   data3   data4   data5   data6  
  0.00    0.00  -49.13    0.00    0.00   24.57  

Degrees of Freedom: 6 Total (i.e. Null);  0 Residual
Null Deviance:      8.318 
Residual Deviance: 2.572e-10    AIC: 12

在这一点上,事情开始不妙了。我不确定为什么数据 3 和 6 的互联网是这样的。

val <- predict(fit,data.frame(c(1,1,1,1,1,1)), type = "response")

> val
       1            2            3            4            5            6 
2.143345e-11 2.143345e-11 2.143345e-11 1.000000e+00 1.000000e+00 1.000000e+00 

从逻辑上讲,我做错了什么。我期待一个 1x2 矩阵,而不是 1x6。我想要一个矩阵,它告诉我数据帧向量在 y1 和 y2 中为“1”(真)的概率。

任何帮助,将不胜感激。

注意:我根据马里奥的回复更新了问题的结尾。

4

2 回答 2

0

与 不同lmglm不适用于多元响应变量。作为一种解决方法,您可以安装多个 GLM:

fit1 <- glm(y[,1] ~ x-1, family=binomial(logit))
fit2 <- glm(y[,2] ~ x-1, family=binomial(logit))

或者您可以glmerlme4包中使用,它旨在模拟混合模型,但您可以简单地省略“随机效应”。AFAIK,glmer支持多变量响应。

于 2022-02-15T14:25:36.370 回答
0

参数 newdata 需要是一个 data.frame。你可以这样做:

aux <- data.frame(c(1,1,1,1,1,1))
val <- predict(fit, aux, type = "response")
于 2017-03-09T17:10:42.083 回答