r - 多变量和单变量的 Tukey HSD 返回不同的结果

Question

我试图为多变量数据集运行 Tukey HSD。但是，当我对单个变量运行相同的测试时，结果完全相反。

在运行多个变量时，我在 ANOVA 输出中观察到以下错误：

87 个影响中有 8 个不可估计估计的影响可能不平衡

在为单个变量运行时，我在 ANOVA 输出中观察到以下错误：

估计的影响可能不平衡

这与我收到的完全相反的 Tukey HSD 输出有什么关系吗？另外，我该如何继续解决这个问题？

我使用了 aov() 并且在我的数据集中有接近 500000 个数据点。

更具体地说，以下代码给了我不同的结果：

代码1：

lm_test1 <- lm(y ~ x1+ x2, data=data)
glht(lm_test1, linfct = mcp(x1 = "Tukey"))

代码2：

lm_test1 <- lm(y ~ x1, data=data)
glht(lm_test1, linfct = mcp(x1 = "Tukey"))

请告诉我这是怎么可能的...

score 0 · Accepted Answer

经过一些更多的研究，我找到了答案，所以我想我应该发布这个。R 中的 Anova 是默认类型 - I anova。这意味着我们输入的第一个变量，在不控制任何其他因素的情况下考虑影响，另一方面，对于其他变量，在控制其他变量的影响后显示结果。因此，由于我将变量作为第二个变量输入，因此显示的结果是在控制了第一个变量之后，这是偶然的，与直接影响的方向完全相反。

r - 多变量和单变量的 Tukey HSD 返回不同的结果

1 回答 1

Related

Reference