1

我正在尝试拟合一个具有预测变量TNSTSeff响应变量的模型AUCMET。拟合的结果是:

    mdl1 = 


Linear regression model:
    AUCMET ~ 1 + TNST + Seff

Estimated Coefficients:
                   Estimate    SE         tStat      pValue    
    (Intercept)     1251.5      72.176      17.34    1.4406e-58
    TNST           -2.3058     0.16045    -14.371    1.9579e-42
    Seff            13.087      1.0748     12.176    9.4907e-32


Number of observations: 932, Error degrees of freedom: 929
Root Mean Squared Error: 322
R-squared: 0.197,  Adjusted R-Squared 0.195
F-statistic vs. constant model: 114, p-value = 5.36e-45

在此处输入图像描述

方差分析的结果是

anova(mdl1)

ans = 

             SumSq         DF     MeanSq        F         pValue    
    TNST     2.1395e+07      1    2.1395e+07    206.52    1.9579e-42
    Seff     1.5359e+07      1    1.5359e+07    148.25    9.4907e-32
    Error    9.6243e+07    929     1.036e+05  

诊断图的输出是

plotDiagnostics(mdl)

在此处输入图像描述 你能帮我解释一下这个结果吗?我看到所有 p 均 < 0.05,因此它们的变量对模型很重要。它是一个好模型吗?我应该看什么才能理解它?

4

2 回答 2

1

编辑:现在您使用新信息编辑了问题:

1- 从情节诊断测试中可以看出,有一定比例的点具有高杠杆率。但是这个图并没有揭示高杠杆点是否是异常值。尝试plotDiagnostics(mdl,'cookd')找到异常值(库克距离较大的点)并将它们从数据中删除。

2- ANOVA 表显示这两个变量都很重要,您不能考虑删除它们。


低 R 平方不好吗?

不会。在预测人类行为(例如心理学)等领域,R 平方值很低,因为人类的行为难以预测。此外,如果获得的 R 平方较低但预测良好,则该模型算作好模型。因此,较低的 R 平方不一定会影响重要变量的解释。用于预测的 R 平方应该有多高?嗯,这取决于您对预测区间宽度的要求以及数据中存在多少可变性。虽然精确预测需要高 R 平方,但它本身是不够的,正如我们将看到的那样。另一方面,高 R 平方值并不是天生的好。高 R 平方并不一定表明模型具有良好的拟合度。(阅读更多

接下来做什么?

要检查模型的质量,您可以执行其他测试,例如

  1. 方差分析

要检查拟合模型的质量,请查阅 ANOVA 表。

tbl = anova(mdl)
  1. 诊断图

诊断图可帮助您识别异常值,并查看模型或拟合中的其他问题。

plotDiagnostics(mdl)
  1. 残差

有几个残差图可帮助您发现模型或数据中的错误、异常值或相关性。最简单的残差图是默认直方图(显示残差范围及其频率)和概率图(显示残差分布与具有匹配方差的正态分布的比较情况)。

plotResiduals(mdl)
  1. 还有更多
于 2015-08-10T15:54:26.923 回答
1

r平方/调整后的r平方是皮尔逊相关系数。https://en.m.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient

1 是好的,0 是坏的,所以我会说这是一个糟糕的诗歌模型。

于 2015-08-10T14:22:49.433 回答