2

你好

我在尝试让 glht 或 emmeans 为具有不相等样本大小的数据集定义紧凑字母时遇到问题。当使用 glht 或 emmeans 时,我会得到这些疯狂的紧凑字母。我究竟做错了什么?会不会是因为方差不等?

模型

> Musling.BoxKonc <- aov(BoxHg2 ~ Station, data = Musling)

QQ图 残差图 图形
闪光

> BoxMusling.Tukey <- glht(Musling.BoxKonc, linfct = mcp(Station = "Tukey"))
> cld(BoxMusling.Tukey, alpha = .05, Letters = letters)
      1       2       3       4       5       6       7       8      10      11      12      13      15 
   "ac"   "bcd"    "ef"   "bcd"    "fg"   "bdf"     "a" "bcdeg"   "ade"    "ab"  "adeg"     "g"   "deg" 

埃米斯

> interBoxMusling <- emmeans(Musling.BoxKonc, "Station")
> cld(interBoxMusling, Letter = letters)
 Station emmean    SE  df lower.CL upper.CL .group  
 7         6.87 0.167 141     6.54     7.20  a      
 11        7.28 0.536 141     6.22     8.34  abc    
 1         7.58 0.240 141     7.10     8.05  ab     
 4         7.89 0.225 141     7.44     8.33   bcd   
 10        8.08 0.351 141     7.38     8.77  abcde  
 2         8.14 0.219 141     7.71     8.58   bcd   
 6         8.76 0.240 141     8.28     9.23    cdef 
 12        8.86 0.657 141     7.56    10.16  abcdefg
 8         9.15 0.657 141     7.85    10.45  abcdefg
 3         9.28 0.225 141     8.84     9.73      ef 
 5         9.80 0.232 141     9.34    10.26       fg
 13       10.77 0.294 141    10.19    11.36        g
 15       10.99 0.929 141     9.15    12.82     defg

Confidence level used: 0.95 
P value adjustment: tukey method for comparing a family of 13 estimates 
significance level used: alpha = 0.05 
4

1 回答 1

3

首先,为了确保每个人都在同一页面上,紧凑字母显示 (CLD) 的构造方式是,共享相同字母的两个表示在规定的显着性水平上彼此不会“显着不同”。

在具有同质误差方差的良好平衡情况下(即每次比较的 SE 相同),那么无论如何,所有组都将具有凝聚力,即如果两个均值共享一个分组字母,则所有组表示它们之间共享相同的分组字母。但是,如果用于比较两个均值的 SE 不完全相同,则分组中可能存在间隙;而当这些SE之间的差距与手段之间的差异相比存在巨大差异时,这种差距几乎肯定会发生,从而导致可能被视为“疯狂”的紧凑型字母显示。

要了解我们在这里看到的细节,首先请注意,在这个简单的模型中,拟合值与估计的边际均值 (EMM) 完全相同;cld(interBoxMusling)因此,残差与拟合图中的垂直点堆栈以与调用​​的从上到下的顺序完全相同的顺序从左到右出现。这使得识别每个条目的情况变得容易。例如,图中最左边的点堆栈对应于第 7 站,其 EMM 为 6.87,并且有相当多的数据。另请注意,站 7 只有一个分组字母 ,a因此它与站 11、1、10、12 和 8 分组,但在统计上与其他站不同。中存在空隙a分组,第一个发生在第 4 站(图中左起第 4 个),其 EMM 为 7.89;该站和 7 号站都有相当多的数据,因此这两个站明显不同,因此不在同一组中。

但是第 12 站和第 8 站呢,这是一条很长的路,以及图中“9”刻度线两侧的两个 EMM?他们也在群里a。在图中,观察到每个站点中只有 2 个观测值。这使得这些站点很难与其他方式有显着差异——没有太多数据表明存在差异,而统计显着性首先与是否有证据(数据)得出一个区别。事实上,由于样本量小,而且这两个站点在均值列表中处于中间位置,因此它们在统计上与任何其他站点没有区别——它们共享每一个分组字母。

最大的平均值属于 15 号站,该站只有一个观测值(请注意,该平均值的 SE 大于其他任何值)。但因为它是最大的 EMM,它仍然与其他一些显着不同,并且不共享分组字母abc

通常,如果您查看具有最多分组字母的均值,则那些往往是样本量最小的均值,反之亦然。

正是样本量的差异使 CLD 看起来“疯狂”。我建议这是一个示例,说明 CLD 如何令人困惑,这是它们的几个不良品质之一。我要提到的其他人是:

  • CLDS 依赖于 P 值的硬截止,在本例中为 0.05,而其他一些显示 P 值的方式允许在判断显着性时使用灰色区域。
  • CLD 强调发现而不是发现。两种手段在统计上没有差异不是一个发现,这是一种我们不能说任何确定性的情况。这就是为什么 CLD 在这种情况下看起来很疯狂的原因。分组字母使这些方法看起来属于一起,而实际上它们根本不属于一起。

另一个有点不相关的点:这个例子中 CLD 的疯狂与不等方差无关。这是因为显示的结果仅取决于与数据拟合的模型,并且aov()模型假定所有观测值具有相同的方差。这在站点 12 和 8 中再次值得注意,它们每个都有两个观测值,但它们在站点 8 中非常接近,在站点 12 中相距较远。表格结果显示两个 EMM 的 SE 相同,这是因为它们具有相同的 SE样本量。如果我们使用允许不同方差的模型,那么这些 SE 就会有所不同。CLD 显示器也会有所不同:仍然很疯狂,但以不同的方式疯狂。

顺便说一下,由于上述原因,显示的条形图不适合此分析,因为它估计每个站点的不同方差。请注意,站 8 和站 12 的误差线非常不同,即使表中的 SE 相同。(请注意,15 站根本没有误差条,因为只有一个观测值,因此没有误差方差估计。)在进行分析时,重要的是所有显示的结果都基于相同的模型,除非明确指出正在考虑不同的模式。

emmeans包确实提供了其他合理紧凑地显示成对比较的方法这里要考虑的两个是pwpp()(成对 P 值图),它以图形方式显示 P 值,以及pwpm(),它以矩阵形式显示它们。当然,pairs()summary()函数可用于详细的、不太紧凑的演示。该plot()函数有一个comparisons显示“比较箭头”的选项,但它并不总是有效,而且在这个例子中几乎肯定会失败。

于 2020-07-19T19:20:59.150 回答