我在 R 中创建的模型是:
fit <- lm(hired ~ educ + exper + sex, data=data)
我不确定的是如何拟合模型以预测 p = pr(hiring = 1) 的兴趣概率。
任何帮助将不胜感激,克莱
编辑:那么 glm 在我的模型中扮演什么角色?(我在下面的回答)根据 Jason 对 Greg 的回答所做的编辑,我看不出它具体做了什么。
我的回答是否分析了被录用的几率?
我在 R 中创建的模型是:
fit <- lm(hired ~ educ + exper + sex, data=data)
我不确定的是如何拟合模型以预测 p = pr(hiring = 1) 的兴趣概率。
任何帮助将不胜感激,克莱
编辑:那么 glm 在我的模型中扮演什么角色?(我在下面的回答)根据 Jason 对 Greg 的回答所做的编辑,我看不出它具体做了什么。
我的回答是否分析了被录用的几率?
对于使用 估计的模型glm
,您可以使用该predict
函数为数据集中的每个观测值提取线性预测变量。然后,您可以简单地使用适当的概率分布函数来获得预测概率。例如,在逻辑回归的情况下,使用plogis
. 换句话说,如果mod
您的模型适合glm
:
> plogis(predict(mod))
假设您估计了一个逻辑模型,将返回数据集中每个观察值的预测概率。如果您需要计算不在数据集中的点的预测概率,请参阅newdata
选项predict
。请注意,predict
还可以提供每个点的标准误差。查看文档以predict.glm
获取更多信息。
编辑:正如格雷格所建议的,您可以type="response"
在电话中使用免费predict
获得:plogis
> predict(mod, type="response")
So I did my best to interpret the glm notes that I found and this is what I came up with.
> test<-glm(hired ~ educ + exper + sex, data=data, family=binomial())
> summary(test)
Call:
glm(formula = hired ~ educ + exper + sex, family = binomial(),
data = data)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.4380 -0.4573 -0.1009 0.1294 2.1804
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -14.2483 6.0805 -2.343 0.0191 *
educ 1.1549 0.6023 1.917 0.0552 .
exper 0.9098 0.4293 2.119 0.0341 *
sex 5.6037 2.6028 2.153 0.0313 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 35.165 on 27 degrees of freedom
Residual deviance: 14.735 on 24 degrees of freedom
AIC: 22.735
Number of Fisher Scoring iterations: 7