我正在估计泊松回归,并想估计我的系数的经济意义(边际效应)。
我向我建议了三种方法:
- 边距,dydx(_all)
- 边距,dydx(_all) atmeans
- 泊松, irr
我想知道哪种方法最好使用。
均值处的边际效应(#2)通常不是一个好主意,因为均值可能对应于一个不具代表性的、荒谬的值,尤其是当您的 X 包含分类变量时。你真的关心半个女性和 10% 怀孕的人的累加效应吗?可能不是。当计算成本很高时,此 ME 更常用。at()
如果您想走这条路,您可以使用该选项来选择更合适的值。
平均边际效应 (#1) 为您提供对预期计数的平均加性效应。
IRR 选项 (#3) 为您提供了均值的乘法效应。
这是医生数据的简单示例:
. use http://www.stata-press.com/data/r13/dollhill3, clear
(Doll and Hill (1966))
. bys smokes: sum deaths
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-> smokes = 0
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
deaths | 5 20.2 12.61745 2 31
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-> smokes = 1
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
deaths | 5 126 70.52659 32 206
如您所见,吸烟者群体的平均死亡人数为 126 人。对于非吸烟者,仅为 20.2 人。
内部收益率:
. poisson deaths i.smokes, irr
Iteration 0: log likelihood = -136.6749
Iteration 1: log likelihood = -136.56351
Iteration 2: log likelihood = -136.56346
Iteration 3: log likelihood = -136.56346
Poisson regression Number of obs = 10
LR chi2(1) = 426.21
Prob > chi2 = 0.0000
Log likelihood = -136.56346 Pseudo R2 = 0.6094
------------------------------------------------------------------------------
deaths | IRR Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
1.smokes | 6.237624 .66857 17.08 0.000 5.055737 7.695802
_cons | 20.2 2.009975 30.21 0.000 16.62087 24.54986
------------------------------------------------------------------------------
吸烟者的死亡人数为 6.237624*20.2=126。
现在我们计算加法效应:
. margins, dydx(smokes)
Conditional marginal effects Number of obs = 10
Model VCE : OIM
Expression : Predicted number of events, predict()
dy/dx w.r.t. : 1.smokes
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
1.smokes | 105.8 5.407402 19.57 0.000 95.20169 116.3983
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.
这表明吸烟者的死亡人数应该比不吸烟者多 105.8 倍。20.2+105.8=126。
在这个简单的模型中, margins, dydx(smokes) atmeans
会给出相同的答案。你能看出为什么吗?