0

我正在对人口普查区失业率的决定因素进行统计分析。以前关于我的主题的一些文献使用了直接 OLS 回归,我从这种类型的分析开始,但在我自己的进一步阅读之后,我认为广义线性模型更好。这尤其是因为我有兴趣根据我的回归呈现人口普查区失业率的预测值,并且我希望这些值有适当的界限(包括 0% 和 100% 之间)。我的失业率包括一些人口普查区的 0,所以我需要考虑到这一点。

我的问题是:

  1. Statafracreg logit是否等同于glm具有 logit 链接和二项式系列的程序?(我已经在包括这里glm在内的几个地方读过关于使用该版本的信息,但看到这是一个新的命令,似乎服务于相同的目的)。使用时可以指定与该选项等效的选项吗?fracregrobustfracreg logit

  2. 如果使用fracreg,我应该在什么基础上决定使用分数概率 ( fracreg probit) 或分数 logit ( fracreg logit) 回归?

  3. 一个简单的(可能是无知的)解释问题:我看到上面提到的fracregglm回归没有报告 R 平方值。我可以计算这些回归的等效度量吗?我的 OLS R-squared 值相当高,这对我来说是一个保证点,所以我想看看这些模型的比较(尽管我知道 R-squared 并不是一切!)。

  4. 如果使用这些模型,我应该记住任何其他限制或假设(例如 OLS BLUE 之外的其他假设)?通过我的 OLS 回归,我采用了失业率的自然对数(使我的残差更正常、更高的 R 平方和方便的解释)。我可以对上面的fracregorglm回归做同样的事情吗?

自从我正式研究有限因变量以来已经有一段时间了,所以请原谅我对这些问题的无知。

我在这里的Statalist 交叉发布了这个问题。

4

1 回答 1

0

这不是 Stata 特定的,但请查看Paolino 的 2001 年“具有 Beta 分布因变量的模型的最大似然估计; ”至少会突出对 OLS 提供有偏估计器的原因进行的简单回顾。

嘿,跟进:有人确实提出了 Stata 解决方案,请查看“Buckley,Jack。2003。“具有 Beta 分布因变量的模型估计:Paolino 研究的复制和扩展。”政治分析。11(2): 204-205。”

于 2016-05-02T12:49:52.020 回答