0

我有一个包含 3719 个观察值的数据集,有 9 个特征。我已经使用选定的特征执行了多元线性回归。我得到了这样的诊断图:

这个

我通过绘图了解到因变量和自变量之间没有线性关系。残差图给出非线性趋势。但从正态 QQ 图中,它遵循正态分布。我没有得到残差与杠杆图的含义是什么?

我理解正确吗?如何解释这些情节。

4

1 回答 1

0

您的残差表现出异方差性(左上角),这意味着您的结果的可变性随着结果的值而增加。例如,收入与支出:较富裕的人在他们购买的食物价格上具有更大的可变性(他们有时会购买便宜的食物,有时会购买昂贵的食物),而较贫穷的人往往只购买便宜的食物。

QQ 图(左下角)评估了残差假设的正态性,我看不出任何严重违规的迹象。不过,右上角的轻微偏离并不像您的异方差问题那么严重。

残差与杠杆图(右下)表示可能对基于库克距离的结果有很大影响的点。这有助于识别数据中的异常值,您可以考虑在运行另一个模型之前忽略这些异常值(相当主观的评估)。

于 2020-03-06T07:49:59.903 回答