1

我想确定概率回归中每个因变量的边际效应,如下所示:

  • 用每个变量的平均值预测(基础)概率
  • 对于每个变量,如果变量取平均值 + 1x 变量标准差,则预测与基本概率相比的概率变化

在我的一个回归中,我有一个乘法变量,如下所示:

my_probit <- glm(a ~ b + c + I(b*c), family = binomial(link = "probit"), data=data)

两个问题:

  1. 当我使用上述方法确定边际效应时,乘法项的值是否会反映 b 或 c 的值,取值均值 + 1x 变量标准差?
  2. 同样的问题,但使用交互项(* 并且没有 I())而不是乘法项。

非常感谢

4

1 回答 1

4

在解释涉及交互项的模型结果时,一般规则是不要解释系数。相互作用的存在意味着术语系数的含义将根据用于预测的其他变量值而变化。查看结果的正确方法是构建一个“预测网格”,即一组跨感兴趣范围(希望在数据支持范围内)间隔的值。此过程的两个基本功能是expand.gridpredict

dgrid <- expand.grid(b=fivenum(data$b)[2:4], c=fivenum(data$c)[2:4]
# A grid with the upper and lower hinges and the medians for `a` and `b`.

predict(my_probit,  newdata=dgrid)

您可能希望在默认值以外的范围内进行预测(即返回线性预测器),因此如果是这样的话,可能会更容易解释:

predict(my_probit,  newdata=dgrid, type ="response")

请务必阅读?predict?predict.glm使用一些简单的示例,以确保您得到了您想要的。

包含交互作用的模型(至少涉及 2 个协变量的模型)的预测应该被认为是三维的曲面或二维流形。(并且对于作为等值包络的 3 协变量交互。)非交互模型可以分解为单独的术语“效果”的原因是平面预测表面的斜率在所有输入级别上保持不变。交互并非如此,尤其是那些具有乘法和非线性模型结构的交互。在微分方程课程中学到的图形工具和见解可以在这里有效地应用。

于 2013-06-23T22:14:57.300 回答