我正在尝试创建组合箱线图/散点图。到目前为止,我做得很好,但有一个问题让我非常困扰,我一直无法弄清楚。我在 R 中,我已经安装了 ggplot2 包。这是我正在使用的代码:
#(xx= stand in for my data set, which I imported from excel with the
# column labels as the X-axis values)
> boxplot(xx, lwd = 1.5, ylab = 'Minutes', xlab = "Epoch")
> stripchart(xx, vertical = TRUE,
+ method = "jitter", add = TRUE, pch = 20, col = 'blue')
这给了我一个非常接近我想要的图,但问题是异常值在图表上放置了两次。如果可能的话,我想让条形图排除它们(最高的蓝点组),并且只使用箱线图中的那些(黑色轮廓圆圈),这样它们就可以脱颖而出并且看起来不那么草率。
我试图通过将许多不同的异常值参数放入 stripchart 命令来改变有问题的点,不幸的是没有运气。我尝试将 y-limits 设置为低于它们的值,尝试使用 outline=false(它完全删除了条形图),尝试更改异常值颜色、outpch 等。该命令对任何这些尝试都不起作用。下面是一个 ylim 的例子:
> stripchart(xx, vertical = TRUE,
+ method = "jitter", add = TRUE, pch = 20, col = 'blue', ylim = true,
ylim (0,20))
ylim(0, 20) 中的错误:找不到函数“ylim”
这是一个异常颜色的例子:
> stripchart(xx vertical = TRUE,
+ method = "jitter", add = TRUE, pch = 20, col = 'blue', outcol = "black")
警告消息:
1:在 plot.xy(xy.coords(x, y), type = type, ...) 中:“outcol”不是图形参数
.......# 警告消息照此继续。
条形图是否能够排除异常值?还是我对它们(以及作为一个整体,就此而言)还不够了解,无法有效地编写代码?
如果可以做到这一点,我应该如何进行?只要图上的视觉效果相同,我完全可以接受不直接解决数据方面异常值问题的解决方案。
感谢您的时间和您可以提供的任何帮助!
编辑:这是一些可以使用的数据。顶行是列标签,下面是数据。抱歉,如果这种格式不好。第 9 行数据中的 29 和 30 等,总体第 10 行,是我的图表中绘制为异常值的一些点的示例,我想保留在箱线图中但不保留在散点图中/条形图。
1 5 10 15 30 60
7.233333333 8.166666667 9.666666667 7.75 9 7
7.133333333 9.25 9.333333333 9.75 10 11
0.733333333 0.5 0.833333333 1 1 0
1.766666667 1.166666667 1 0.75 1 0
1.75 2.25 2.333333333 2.25 1 1
6.75 7 7.166666667 7.75 6.5 7
1.516666667 1.75 1.333333333 2 2 2
1.533333333 1.5 2 1.25 1.5 2
27.3 28.33333333 29.33333333 30.25 28.5 29
6.35 6 6.333333333 7 6 6
7.083333333 8.333333333 8.833333333 8.75 8 8
8.533333333 10.08333333 10.5 12 10.5 11
7.65 8.416666667 9 10.75 9 12
6.85 7.333333333 8 7.25 6 8
4.433333333 5 5.5 5 6.5 6
8.616666667 10 11.66666667 12.25 13 12
3.633333333 3.75 3.5 3.25 3 2
0.8 0.75 0.833333333 1 1 0
7.283333333 8.583333333 9.666666667 9.75 12 8
7.483333333 8.75 8.333333333 7.75 6.5 7
3.466666667 2.916666667 3.166666667 2.5 2 0
5.483333333 6.416666667 6.833333333 6.75 7 8