0

我写信是想问问你对如何解释这个案子的看法。我有两个要比较的向量“a”和“b”。

wilcoxon 测试给了我 5.139217e-303 的 a 超过 b 的 pvalue,而替代的“更大”。现在,如果我对它们中的每一个进行总结,我将得到以下信息

> summary(a)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
0.0000000 0.0001411 0.0002381 0.0002671 0.0003623 0.0012910 
> summary(c)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
0.0000000 0.0000000 0.0000000 0.0004947 0.0002972 1.0000000

然后平均比率约为 0.5399031,它天真地与 wilcoxon 测试相反(我期待找到一个比率 >> 1)

即使使用异常值包删除异常值后,我仍然有同样的事情。有人可以帮我解释为什么我有这个结果以及如何解释吗?

提前致谢

4

1 回答 1

3

由于您尚未发布您的数据,这确实是一个困难的问题并发布您的数据(例如,通过dput()会使事情变得更容易。除此之外,我们只能指定。有关通过可重复的示例提出一个很好的问题的更多信息,请参见此处.

但是,您的数据具有一些我们可以从中看到的属性,这些属性可以summary提供答案。

Wilcoxon 测试似乎不适合您的数据。请记住,Wilcoxon 使用每个观察值的等级。由于数据中存在关联,因此很难获得排名。你似乎有很多联系(min并且两者都是median)。有一些方法可以处理关系,但其他方法更好。c0

由于您似乎确实不想使用 t 检验(考虑到分布似乎确实不同,这是合理的,例如median(a) < mean (a)但是median(c) > mean(c)),另一种方法是使用置换检验。

我的包afex(在 CRAN 上,基于coin)包含compare.2.vectors使用(例如)t 检验、Wilcoxon 和最显着的置换检验比较两个向量的函数。如果您的 n 很小,您甚至可以使用精确的测试分布进行置换测试。给定两个向量 a 和 c 结果可能是(试图模拟您的数据):

> require(afex)
> a <- round(runif(100, 0, 0.00129), 5)
> c <- c(rep(0, 60), runif(37, 0, 0.00297), rep(1, 3))
> summary(a)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
0.0000100 0.0002775 0.0006500 0.0006360 0.0009475 0.0012800 
> summary(c)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
0.00000 0.00000 0.00000 0.03054 0.00116 1.00000 

> compare.2.vectors(a,c)
$parametric
   test test.statistic test.value   test.df          p
1     t              t  -1.745388 198.00000 0.08246866
2 Welch              t  -1.745388  99.00094 0.08402002

$nonparametric
             test test.statistic  test.value test.df            p
1 stats::Wilcoxon              W 6772.000000      NA 1.143036e-05
2     permutation              Z   -1.736482      NA 1.929300e-01
3  coin::Wilcoxon              Z    4.389418      NA 0.000000e+00
4          median              Z   -4.514156      NA 0.000000e+00

您会看到相同的模式,Wilcoxon 的阳性测试统计数据,但所有其他测试的阴性结果。所以最好不要使用 Wilcoxon,但其他测试之一,都同意。

PS:我很高兴对该功能发表评论。还有更多有意义的测试吗?

于 2012-09-19T22:02:07.670 回答