0

我试图为多变量数据集运行 Tukey HSD。但是,当我对单个变量运行相同的测试时,结果完全相反。

在运行多个变量时,我在 ANOVA 输出中观察到以下错误:

87 个影响中有 8 个不可估计 估计的影响可能不平衡

在为单个变量运行时,我在 ANOVA 输出中观察到以下错误:

估计的影响可能不平衡

这与我收到的完全相反的 Tukey HSD 输出有什么关系吗?另外,我该如何继续解决这个问题?

我使用了 aov() 并且在我的数据集中有接近 500000 个数据点。

更具体地说,以下代码给了我不同的结果:

代码1:

lm_test1 <- lm(y ~ x1+ x2, data=data)
glht(lm_test1, linfct = mcp(x1 = "Tukey"))

代码2:

lm_test1 <- lm(y ~ x1, data=data)
glht(lm_test1, linfct = mcp(x1 = "Tukey"))

请告诉我这是怎么可能的...

4

1 回答 1

0

经过一些更多的研究,我找到了答案,所以我想我应该发布这个。R 中的 Anova 是默认类型 - I anova。这意味着我们输入的第一个变量,在不控制任何其他因素的情况下考虑影响,另一方面,对于其他变量,在控制其他变量的影响后显示结果。因此,由于我将变量作为第二个变量输入,因此显示的结果是在控制了第一个变量之后,这是偶然的,与直接影响的方向完全相反。

于 2016-04-21T06:06:37.607 回答