我想生成一个看起来像这样的图形:
我的原始数据集如下所示:
> bb[sample(nrow(bb), 20), ]
IMG QUANT FIX
25663 1 1 0
7936 2 2 0
23586 3 2 0
23017 2 2 1
31363 1 3 1
7886 2 2 0
23819 3 3 1
29838 2 2 1
8169 2 3 1
9870 2 3 0
31440 2 1 0
35564 3 1 0
24066 1 2 0
12020 3 2 0
6742 3 2 0
6189 2 3 0
26692 2 3 0
1387 3 2 0
31839 2 3 1
28637 3 2 0
所以想法是条形显示 where FIX = 1
per factorQUANT
和 per factor IMG
。
我已经将我的数据集聚合成百分比使用plyr
library(plyr)
bb.perc <- ddply(bb,.(QUANT,IMG),summarise,FIX.PROP = sum(FIX) / length(FIX))
它几乎做了正确的事情:
QUANT IMG FIX.PROP
1 1 1 0.52439024
2 1 2 0.19085366
3 1 3 0.13658537
4 2 1 0.20414201
5 2 2 0.53964497
6 2 3 0.09585799
7 3 1 0.29000000
8 3 2 0.13000000
9 3 3 0.40705882
但是现在如果我制作一个图表,它并没有考虑到这些FIX==0
情况,即所有条形都有相同的高度,即 100%,这不是我想要的。请注意各个 QUANT 子帧如何不等于 100%:
> sum(bb.perc[1:3,]$FIX.PROP)
[1] 0.8518293
> sum(bb.perc[4:6,]$FIX.PROP)
[1] 0.839645
> sum(bb.perc[7:9,]$FIX.PROP)
[1] 0.8270588
我能用 R 做的最好的事情是显示计数:
# Take only the positive samples
bb.pos <- bb[bb$FIX == 1,]
# Plot the counts
ggplot(bb,aes(factor(QUANT),fill=factor(IMG))) + geom_bar() +
scale_y_continuous(labels=percent)
结果是: 这也不是我想要的:
- 百分比比例太差了。我需要一种将 100% 点传递给
percent
函数的方法,但我不知道如何。 - 它缺少标签。
已经有很多关于 SO 的类似问题,但我似乎缺乏足够的智慧(或对 R 的理解)来从它们推断出我的特定问题的解决方案。
感谢您的任何指点!
编辑:Sven Hohenstein 已经提供了答案,但我自己也是这样做的:
> ggplot(bb.perc,aes(x=factor(QUANT),y=FIX.PROP,label=paste(round(FIX.PROP*100),
"%"),fill=factor(IMG)))+ geom_bar(stat="identity") + geom_text(position="stack",
aes(ymax=1),vjust=5) + scale_y_continuous(labels = percent)
使用bb.perc
我进一步定义的plyr
. 这个的优点是百分比是在每列本地计算的,而不是全局计算的。
感谢大家的帮助。以下两个问题及其各自的答案极大地帮助了我做对:
我最初做错的是将position = "fill"
参数传递给
geom_bar()
,由于某种原因,这使得所有条形都具有相同的高度!