考虑我有一个包含 12 个变量的数据集,它包含大约 100 个案例。如果我要在两个变量之间进行 t 检验,然后在 3 个其他变量之间进行方差分析,然后是事后。也许在那之后,非参数变量的 Mann-Whitney ...... 我的问题是,如果我要在 ANOVA 中使用 Bonferroni 进行事后处理,我应该如何计算家庭误差?分析族什么时候开始?什么时候结束?
2 回答
顾名思义,FWER 是在执行多个假设检验时做出一个或多个错误发现的概率。
如果你对同一个假设尝试两个不同的测试,这是同一个假设,所以你不要做 FWER。
在事后,您正在重复测试变量之间的差异,您可以在那里应用 Bonferroni。
“如果我要在两个变量之间进行 t 检验,然后在其他 3 个变量之间进行方差分析,那么事后”似乎具有误导性。
如果您在谈论 1-way ANOVA,那么您只能对 2 个变量执行此操作:1 个数值/度量响应变量(研究人员通常称其为“因变量”)和 1个分类/非度量预测变量(研究人员通常称它是“自变量”)具有2 个或更多类别。
如果方差分析的零假设(所有组/类别的平均值相同)被拒绝,则意味着组/类别中至少有一个具有显着不同的平均值。
要进一步分析哪些组具有统计学上显着不同的均值,您需要成对比较。为此,您可以使用事后测试。
事后检验由成对比较组成,旨在比较组的所有不同组合的平均值。因此,这更像是取每一对组,然后对每对组进行 t 检验。
为了调整家庭方面的错误,有一些方法。Bonferroni提出了一种将 p 值除以检验次数的简单方法,称为 Bonferroni 调整 p 值。但是,这种调整非常保守。为了减少错误发现,它增加了假阴性的机会。还有一些其他的事后测试,如 LSD、Tuckey、SNK、Welch Q 过程、Dunn 和 Scheffe 过程等。
现在,来回答你的问题:“我应该如何计算全族误差?分析族什么时候开始?什么时候结束?”
想象一下,您对每对组执行单独的 t 检验。您需要在 A 和 B、A 和 C 和 B 和 C 组的平均值(响应变量)之间进行三个比较 - 假设您的预测变量/自变量具有三个组 A、B 和 C。
如果这些 t 检验中的每一个都使用 0.05 的显着性水平,那么对于每个检验,错误地拒绝原假设(称为 I 型错误)的概率仅为 5%。因此,对于每个测试,没有 I 类错误的概率为 0.95 (95%)。
如果我们假设每个测试都是独立的(因此,我们可以将概率相乘),那么没有 I 类错误的总体概率是 (.95)3 = .95 × .95 × .95 = .857,因为没有每个测试的 I 类错误为 0.95,共有三个测试。
假设没有 I 类错误的概率是 0.857,那么我们可以通过从 1 中减去这个数字来计算至少犯一个 I 类错误的概率(请记住,任何事件发生的最大概率是 1)。因此,至少出现一个 I 类错误的概率为 1 - .857 = .143,即 14.3%。
因此,在这组测试中,犯 I 类错误的概率从 5% 增加到 14.3%。在相同实验数据上进行的统计测试中的错误率称为全族或实验错误率。
阅读更多关于选择合适的测试、假设和解释、多重测试、事后和对比的信息。无论您使用什么工具(SPSS/SAS/R),概念都是一样的。您可以参考使用 IBM SPSS 发现统计数据或使用 Andy Field 的 R 发现统计数据以了解更多详细信息。