2

我有一个数据集,按照嵌套的要点组织成子类别和子子类别:

-1
 -1a
  -1ai
  -1aii
 -1b
  -1bi

...等等。

我想使用 ggplot2 制作一个点图,其中显示1的所有数据,然后仅显示1a的数据,然后仅显示1ai的数据,依此类推。

示例数据集:

x <- data.frame(cat=1, subA=letters[rep(1:5,each=10)], 
subB=as.character(as.roman(rep(1:5,5,each=2))),value=rnorm(50,20,7))

> head(x)
  cat subA subB    value
1   1    a    I 26.75573
2   1    a    I 12.52218
3   1    a   II 24.53499
4   1    a   II 23.21012
5   1    a  III 11.18173
6   1    a  III 25.01914

我想最终得到一个看起来像这样的图表:

子集和整体数据点图

我能够通过做大量子集和 rbinding 来制作这个图,以制作大量冗余的衍生数据框,但这似乎是做错事的一个明显例子。

x2 <- with(x,rbind(cbind(key="1",x), 
cbind(key="1 a",x[paste(cat,subA) == "1 a",]), 
cbind(key="1 a I",x[paste(cat,subA,subB) == "1 a I",]), 
cbind(key="1 a II",x[paste(cat,subA,subB) == "1 a II",])))

library(ggplot2)
library(plyr)
ggplot(x2,aes(x=reorder(key,desc(key)),y=value)) 
+ geom_point(position=position_jitter(width=0.1,height=0)) 
+ coord_flip() + scale_x_discrete("Category")

有没有更好的方法来做到这一点?一个相关的问题是,如果每个值总是添加相同数量的抖动,无论它是针对“1”还是“1 a”或“1 a II”绘制的,那会很好,但我什至没有确定从哪里开始。

4

1 回答 1

2

除了用单独的组重建数据之外,我想不出其他方法,如下所示:

x.m1 <- x[c("cat", "value")]
x.m2 <- do.call(rbind, lapply(split(x, interaction(x[, 1:2])), function(y) {
    y$cat <- do.call(paste0, y[, 1:2])
    y[c("cat", "value")]
}))
x.m3 <- do.call(rbind, lapply(split(x, interaction(x[, 1:3])), function(y) {
    y$cat <- do.call(paste0, y[, 1:3])
    y[c("cat", "value")]
}))

y <- rbind(x.m1, x.m2, x.m3)

ggplot(data = y, aes(x = value, y = cat)) + geom_point()

ggplot2_multiple_levels

注意:您应该重新排序cat列的级别y以按照您想要的方式对 y 轴进行排序。我会把它留给你。

编辑:按照@Justin 的建议,您可以执行以下操作:

x.m1 <- x
x.m1$grp <- x$cat
x.m2 <- do.call(rbind, lapply(split(x, interaction(x[, 1:2])), function(y) {
    y$grp <- do.call(paste0, y[, 1:2])
    y
}))
x.m3 <- do.call(rbind, lapply(split(x, interaction(x[, 1:3])), function(y) {
    y$grp <- do.call(paste0, y[, 1:3])
    y
}))

y <- rbind(x.m1, x.m2, x.m3)

ggplot(data = y, aes(x = value, y = grp)) + geom_point(aes(colour=subA, shape=subB))

ggplot2_multiple_levels_color_shape

于 2013-02-26T15:56:45.010 回答