1

我有一个数据集,我想在 R 中制作一个箱线图。我可以通过 R 控制台中的以下命令简单地做到这一点(这里我只使用了一些示例数据):

x <- rnorm(100);

y <- rnorm(100);

boxplot(x, y, col=rainbow(2))

在此处输入图像描述

现在我真正想要的是在上面的箱线图上显示我的数据集的(平均 +/-(2 或 3)*sigma)标记。我确实知道标准差和平均值不是稳健的统计数据,但对于我的数据集,这些信息可能有用。即预期的数字应如下所示:

在此处输入图像描述 其中(不同颜色的)虚线表示相应图的 95% 或 99.7% 置信区间或(平均值 +/-(2 或 3)*sigma)。

注意不幸的是,由于我没有足够的声誉,因此我无法在此处添加数字,如果有人可以从上述链接上传到此处,将不胜感激。

4

1 回答 1

2

一件非常简单易行的事情是notch=TRUE在函数中使用参数boxplot()(参见?boxplot)。这与平均值的 95% 置信区间并不完全相同,而是类似于中位数的 95% CI(这将解决您对稳健性的担忧)。这里解释:

槽口(如果需要)扩展到 +/-1.58 IQR/sqrt(n)。这似乎基于与 Chambers 等人的 1.57 公式相同的计算。(1983 年,第 62 页),见 McGill 等人。(1978 年,第 16 页)。它们基于中位数的渐近正态性和被比较的两个中位数大致相等的样本量,并且据说对样本的潜在分布相当不敏感。这个想法似乎是为两个中位数的差异提供大约 95% 的置信区间。

于 2013-06-17T19:23:44.723 回答