-2

我正在估计泊松回归,并想估计我的系数的经济意义(边际效应)。

我向我建议了三种方法:

  1. 边距,dydx(_all)
  2. 边距,dydx(_all) atmeans
  3. 泊松, irr

我想知道哪种方法最好使用。

4

1 回答 1

3

均值处的边际效应(#2)通常不是一个好主意,因为均值可能对应于一个不具代表性的、荒谬的值,尤其是当您的 X 包含分类变量时。你真的关心半个女性和 10% 怀孕的人的累加效应吗?可能不是。当计算成本很高时,此 ME 更常用。at()如果您想走这条路,您可以使用该选项来选择更合适的值。

平均边际效应 (#1) 为您提供对预期计数的平均加性效应。

IRR 选项 (#3) 为您提供了均值的乘法效应。

这是医生数据的简单示例:

. use http://www.stata-press.com/data/r13/dollhill3, clear
(Doll and Hill (1966))

. bys smokes: sum deaths 

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-> smokes = 0

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
      deaths |         5        20.2    12.61745          2         31

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-> smokes = 1

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
      deaths |         5         126    70.52659         32        206

如您所见,吸烟者群体的平均死亡人数为 126 人。对于非吸烟者,仅为 20.2 人。

内部收益率:

. poisson deaths i.smokes, irr

Iteration 0:   log likelihood =  -136.6749  
Iteration 1:   log likelihood = -136.56351  
Iteration 2:   log likelihood = -136.56346  
Iteration 3:   log likelihood = -136.56346  

Poisson regression                                Number of obs   =         10
                                                  LR chi2(1)      =     426.21
                                                  Prob > chi2     =     0.0000
Log likelihood = -136.56346                       Pseudo R2       =     0.6094

------------------------------------------------------------------------------
      deaths |        IRR   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
    1.smokes |   6.237624     .66857    17.08   0.000     5.055737    7.695802
       _cons |       20.2   2.009975    30.21   0.000     16.62087    24.54986
------------------------------------------------------------------------------

吸烟者的死亡人数为 6.237624*20.2=126。

现在我们计算加法效应:

. margins, dydx(smokes)

Conditional marginal effects                      Number of obs   =         10
Model VCE    : OIM

Expression   : Predicted number of events, predict()
dy/dx w.r.t. : 1.smokes

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
    1.smokes |      105.8   5.407402    19.57   0.000     95.20169    116.3983
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.

这表明吸烟者的死亡人数应该比不吸烟者多 105.8 倍。20.2+105.8=126。

在这个简单的模型中, margins, dydx(smokes) atmeans会给出相同的答案。你能看出为什么吗?

于 2014-04-17T02:03:43.593 回答