2

我建立了一个简单的线性回归模型,以“分数”作为因变量,“活动”作为独立变量。'Activity' 有 5 个级别:'listen'(参考级别)、'read1'、'read2'、'watch1'、'watch2'。

Call:
lm(formula = Score ~ Activity)

Residuals:
     Min       1Q   Median       3Q      Max 
-22.6154  -8.6154  -0.6154   7.1346  31.3846 

Coefficients:
               Estimate Std. Error t value Pr(>|t|)    
(Intercept)      41.615      2.553  16.302   <2e-16 ***
Activityread1     6.385      7.937   0.804   0.4254    
Activityread2    20.885      9.552   2.186   0.0340 *  
Activitywatch1    3.885      4.315   0.900   0.3728    
Activitywatch2  -11.415      6.357  -1.796   0.0792 .  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 13.02 on 45 degrees of freedom
Multiple R-squared:  0.1901,    Adjusted R-squared:  0.1181 
F-statistic:  2.64 on 4 and 45 DF,  p-value: 0.04594

为了获得所有成对比较,我执行了 TukeyHSD 测试,我很难解释其输出。虽然模型的输出显示我们唯一的显着效果是由于“listen”和“read2”之间的对比,但 TukeyHSD 结果表明,“watch2”和“read2”之间存在唯一的显着对比。这是什么意思?

> TukeyHSD(aov(mod4), "Activity")
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = mod4)

$Activity
                    diff        lwr       upr     p adj
read1-listen    6.384615 -16.168371 28.937602 0.9279144
read2-listen   20.884615  -6.256626 48.025857 0.2034549
watch1-listen   3.884615  -8.376548 16.145779 0.8952957
watch2-listen -11.415385 -29.477206  6.646437 0.3885969
read2-read1    14.500000 -19.264610 48.264610 0.7397464
watch1-read1   -2.500000 -26.031639 21.031639 0.9981234
watch2-read1  -17.800000 -44.811688  9.211688 0.3466391
watch1-read2  -17.000000 -44.959754 10.959754 0.4278714
watch2-read2  -32.300000 -63.245777 -1.354223 0.0368820
watch2-watch1 -15.300000 -34.569930  3.969930 0.1783961

4

1 回答 1

1

在您的初始模型摘要中,Estimate显示了每个组相对于“听”组的平均值的估计差异 (40.615)。p = .0340当仅计算这 4 个比较时,“read2”组与“listen”组的最大偏移 (+20.885) 称为显着。

由于TUKEYHSD正在对组均值执行所有成对比较(不再只是参考水平“听”),它还在执行 p 值调整以解释所有这些额外的测试。原因是,如果您对随机数据进行了 20 次比较,您会期望其中一个(1/20 或 .05)被称为显着性,p < .05仅仅是因为进行了这么多测试。考虑到 p 值调整后,您最初在“listen - read2”之间进行的显着比较不再具有显着性。

p = .03688但是“watch2 - read2”(-32.3)之间的较大差异(-32.3)在原始模型摘要中没有测试,即使在进行了所有额外的比较调整之后,也足以被认为是显着的。

希望对您有所帮助,您可以在此处阅读有关多重比较问题的更多信息 。并查看 ?p.adjustR 对最流行方法的实现。

于 2017-01-08T01:51:24.433 回答