0

使用逻辑回归,我试图模拟女性和收入低于贫困线(两个二元变量)对预测患高血压的概率的边际效应。我创建了一个交互项 (poverty_FEMALE) 来尝试对此进行建模,但不确定我对系数的解释是否正确。

是否正确地说:

  • 低于阈值和男性的边际效应是:0.067 - 0.055
  • 身为女性且不处于贫困状态的边际效应为:0.041 - 0.055
  • 作为女性和贫困的边际效应是-.055?

如果是这样,当这两个变量的系数各自为我们的正值时,为什么贫困和女性的风险较低是有道理的?

pov_FEMALE=(df$BELOW_100_POVERTY*(df$FEMALE))

Marginal Effects:
                       dF/dx  Std. Err.       z     P>|z|    
BELOW_100_POVERTY  0.0670417  0.0243266  2.7559 0.0058531 **  
FEMALE             0.0410705  0.0172280  2.3839 0.0171283 *  
pov_FEMALE        -0.0553485  0.0160284 -3.4531 0.0005541 ***
4

1 回答 1

1

假设显示的 dF/dx 是您想要的边际效应类型,

  • 低于阈值 (0.067) 和男性 (0) 的边际效应是:0.067

  • 身为女性 (0.041) 且不处于贫困 (0) 的边际效应为:0.041

  • 身为女性 (0.041) 和贫困 (0.067) 的边际效应和联合条件 (-0.055) 为:0.041 + 0.067 -.055

思考偏导数的含义。当您对变量 x 进行估计方程的偏导时,直接效应和交互效应是相加的。

假设您描述的变量是指标(值中的 1 或 0),则基数(值 0,例如“男性”)的边际效应不会与截距分开识别。人们只能将结果解释为基线概率加上边际效应,在这种情况下,基线被定义为男性和非贫困人口。

于 2020-10-02T21:24:12.290 回答