使用 JMP 软件,如果我在 y 轴上的因变量是连续变量“电影收入”并且预测变量是 4 个分类变量(1 = 动作、2 = 喜剧、3 = 儿童、4 = 其他),那么我发现JMP 软件总是在回归输出中留下 4 个分类变量之一。
遗漏变量的最小二乘均值成为 y 轴上的截距,然后每个其他回归系数都根据该截距进行解释(遗漏变量的最小二乘均值)。在某种程度上,我看到这给出了相同的信息,但变量更少,因为 R 平方没有改变,但为什么它会以这种方式工作。这就是我不明白的。为什么一切都被我们遗漏的东西解释了,我们仍然有相同的 R 方。
在这张图片中,我们省略了“Kids”,所以它的最小二乘均值变成了截距,然后 Action = 56.66 - 45.10 = 11.56 等等