4

在仔细阅读 logit 模型注释时,我很可能遇到了一种叫做“比例参数”的东西。有人可以解释一下那是什么以及它的用途。不使用会发生什么。另外,它也用于概率模型吗?

干杯

4

2 回答 2

4

这是5个月前问的,但无论如何我都会回答。

OP,您可能还记得线性回归中残差平方和的概念。由此,我们可以通过将残差 SS 除以残差自由度来获得模型中误差的标准差的统计量。误差的标准差也称为尺度参数:它是线性回归中误差sigmaN(mu, sigma)分布。

在逻辑回归中,与残差 SS 类似的统计量是残差:在考虑预测变量的影响后,模型中无法解释的变化量。现在理论上,逻辑回归没有尺度参数:请注意,sigma二项式分布中没有等价物。(回想一下,逻辑回归假设数据来自二项分布,其参数p是预测变量的函数。)然而,在实践中,我们经常观察到数据中的可变性比模型所能解释的要多. 为此调整模型的一种方法是计算类似于线性回归中的“尺度参数”:残差偏差除以残差 df。

由于过度离散是响应分布的一个属性,它同样适用于概率回归和逻辑回归。

可以证明,在某些假设下,正确指定的逻辑/概率模型中的残差偏差应近似等于残差 df:即,尺度参数应约为 1。尺度参数 > 1 的模型是说是过度分散;您可以通过将系数等的所有 t 统计量除以比例参数来实现这一点,就像在线性回归中一样。

请注意,这并不总是有用的规则。它主要取决于每个二项式观察的试验次数很大的假设,这对于真实数据通常是违反的。例如,如果您有一个二元响应(每个观察值都是 0 或 1),它就会完全崩溃。

于 2013-06-24T01:17:20.697 回答
1

我发现它们也有点难以理解,所以请耐心等待,但也许我有一些可能对你有用的见解。

首先,如果您还没有,请查看 Kenneth Train 的关于基于模拟的估计的书。在他关于 logit 的章节中,甚至还有一个关于比例参数的子章节(第 3.3 章)。

基本上,人们在谈论什么会有所不同,所以这取决于你在想什么。有些人将每个选择的整个条件效用除以 lambda。这个 lambda 通常不会被识别,因为效用的规模是未知的(只有相对差异很重要)。也许当您提出概率时,您讨论了未识别的正态误差项的方差。

但是,还有其他人在讨论如何用(混合)logit 模型逼近随机效用模型时讨论它们。从这个意义上说,这是因为多项式 logit 可以解释为“平滑”的 max 函数。也就是说,如果仅将 IID 极值误差乘以 lambda,则当 lambda -> 0 时,对数和收敛到最大选择(= 间接效用)。Kenneth Train 也谈到了这一点,请查看。

编辑:我认为实际上,如果您遇到数字麻烦,这主要是一件重要的事情。例如,我遇到了一些问题,其中某些数据行的大多数条件选择概率为 0 或 1,这会产生可能性问题。使用更高的 lambda 类型“平滑”了概率(在某种意义上,作为 lambda -> infinity,所有 CCPs -> 1/J(其中 J = 选择数))。

希望它有所帮助。

于 2013-06-23T23:38:49.847 回答