我正在做一个基本的箱线图,其中y=age
和x=Patient groups
age <- ggplot(data, aes(factor(group2), age)) + ylim(15, 80)
age + geom_boxplot(fill = "grey80", colour = "#3366FF")
我希望你能帮助我做一些事情:
1)是否可以在每个组箱线图上方(但不在我的组标签所在的 X 轴上)包括每个组的多个观察值,而不必在绘画中这样做:)?我试过使用:
age + annotate("text", x = "CON", y = 60, label = "25")
CON
第 1 组在哪里,并且y = 60
在该组的箱线图上方。但是,该命令不起作用。我认为它与它读x
作连续变量而不是分类变量有关。
2)此外,虽然有很多关于使用箱线图的平均值而不是中位数的问题,但我仍然没有找到适合我的代码?
3)在同样的问题上,有没有一种方法可以将平均组统计数据包含在箱线图中?也许使用
age + stat_summary(fun.y=mean, colour="red", geom="point")
然而,这仅包括平均值所在的一个点。或再次使用
age + annotate("text", x = "CON", y = 30, label = "30")
哪里CON
是第一组,y = 30
是〜组年龄平均值。知道ggplot2
语法是多么灵活和丰富,我希望有一种更优雅的方式来使用真实的统计输出而不是annotate
.
任何建议/链接将不胜感激!
谢谢!!