我有一个很长的数据集(N=499)。我从中比较了索引在 8 种不同处理中的表现(每种处理中的样本数量不同)。
我已经做过 Kruskal-Wallis,效果显着(p 值 < 2.2e-16)。
现在,对于事后测试,我正在考虑使用 Dunn 测试,但我读到 Wilcoxon 也可能有用,有什么建议吗?
非常感谢大家。
我有一个很长的数据集(N=499)。我从中比较了索引在 8 种不同处理中的表现(每种处理中的样本数量不同)。
我已经做过 Kruskal-Wallis,效果显着(p 值 < 2.2e-16)。
现在,对于事后测试,我正在考虑使用 Dunn 测试,但我读到 Wilcoxon 也可能有用,有什么建议吗?
非常感谢大家。
这个答案确实属于Cross Validated,而不是 stackoverflow,但是:
Wilcoxon(又名 Mann-Whitney aka Mann-Whitney-Wilcoxon)秩和检验不适合作为成对比较的事后检验,因为两个原因拒绝了 Kruskal-Wallis 检验:
秩和检验不使用与 Kruskal-Wallis 检验相同的秩排序。Kruskal-Wallis 检验在所有组中排名,但秩和检验将在每次比较中仅在两组之间排名。这导致每次测试使用不同的排名——实际上是不同的数据。
如果 Kruskal-Wallis 检验的原假设为真,则每个组均来自具有相同观测值方差的总体。该方差的最佳估计是用于计算 Kruskal-Wallis 检验统计量(类似于拒绝单因素方差分析后的事后t检验中的汇总方差)。秩和检验在成对检验的构建中并未包含所有组的汇总方差,而仅在每个检验中包含两组。
Dunn 检验保留了 Kruskal-Wallis 使用的等级,并使用合并方差估计来构建事后近似z检验统计量。
Conover-Iman 检验同样保留了 Kruskal-Wallis 使用的等级,并使用合并方差估计来构建事后 t检验统计量。当且仅当您拒绝 Kruskal-Wallis 检验时,此检验才有效,但它提供了比 Dunn 检验更大的拒绝 null 的能力。