8

我想测试我的线性回归模型的所有假设是否成立。我手动完成了这个,它似乎很好。但是,我想仔细检查函数 gvlma。我得到的输出是:

 gvlma(x = m_lag) 

                Value p-value                   Decision
 Global Stat        82.475 0.00000 Assumptions NOT satisfied!
 Skewness           72.378 0.00000 Assumptions NOT satisfied!
 Kurtosis            1.040 0.30778    Assumptions acceptable.
 Link Function       6.029 0.01407 Assumptions NOT satisfied!
 Heteroscedasticity  3.027 0.08187    Assumptions acceptable.

我的问题是:

  1. 我如何解释全局统计

  2. 由于违反了假设,我现在该怎么办?(与未接受的其他 2 个假设相同)

4

2 回答 2

16
  1. 全局统计 - 您的 X 预测变量和 Y 之间的关系是否大致呈线性?拒绝 null (p < .05) 表示您的一个或多个 X 和 Y 之间存在非线性关系

  2. 偏度 - 您的分布是正偏还是负偏,需要进行转换以满足正态假设?拒绝空值 (p < .05) 表明您可能应该转换数据。

  3. 峰度-您的分布峰度(高峰值或非常浅的峰值)是否需要进行转换以满足正态性假设?拒绝空值 (p < .05) 表明您可能应该转换数据。

  4. 链接函数-您的因变量是真正连续的还是分类的?拒绝空值 (p < .05) 表明您应该使用广义线性模型的替代形式(例如逻辑回归或二项式回归)。

  5. 异方差性-您的模型残差的方差在 X 的范围内是否恒定(假设同方差性)?拒绝零值 (p < .05) 表明您的残差是异方差的,因此在 X 的范围内不是恒定的。您的模型在预测 X 尺度的某些范围时更好/更差。

于 2017-12-08T13:04:18.960 回答
8

我知道这个问题是很久以前写的,但唯一的答案并不准确。

基于 Pena 和 Slate (2006),线性回归中的四个假设是正态性、异方差性和线性,作者称之为不相关性。

对于假设“不相关性”,我通常称其为独立性。作者将独立性称为通过评估不相关性和正态性相结合来验证的度量。作者还提到了其他学者,他们指出这是残差的独立性(左侧第 342 页)。

  1. 全局统计 这是整体指标;这说明模型作为一个整体是通过还是失败。

  2. 偏度 <- 测量分布

  3. 峰度 <- 测量分布、异常值、有影响的数据等

  4. 链接函数<-错误指定的模型,您如何链接模型分配中的元素

  5. 异方差 <- 寻找残差的相等方差

测量值不是具体的偏斜、峰度等;如果您仔细研究这些措施背后的数学原理。这些指标是来自多种统计分析方法的数学推导。在他们的研究中,作者发现,当他们将这四个测量值结合起来时,不仅准确评估了线性回归的四个假设,而且还准确评估了这些假设对残差的交互作用。

为了确定首先要做什么来纠正问题,有必要知道您使用的数据、样本量以及您建立的模型。偏斜的高值可能来自分布、方差等。根据 Pena 和 Slate 的原始工作,需要寻找一些东西,但似乎如果您的样本量大或小,它可能会极大地改变你先来。我还没有完成文章中的所有结论,这是肯定的。

Pena, EA 和 Slate, EH (2006)。线性模型假设的全局验证。美国统计协会杂志,101 (473), 341-354。https://doi.org/10.1198/016214505000000637

于 2020-03-10T21:24:48.913 回答