2

我还有一个关于 ggplot2 的问题……但这次我什至不确定我想要做什么……让我们从一个简单的例子开始;这就是我到目前为止所拥有的:

library(reshape2)
library(ggplot2)

a.df <- data.frame(
  id=c('a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y'),
  var1=c(25,35,46,19,35,68,78,23,65,78,98,32,65,74,24,56,78,12,34,76,87,12,54,87,34), 
  group1=c(1,2,'NONE','NONE',1,2,2,1,3,4,3,'NONE','NONE',4,4,3,1,1,2,3,4,'NONE','NONE',2,3), 
  group2=c(1,'NONE',1,1,2,2,'NONE',2,'NONE',2,3,4,3,4,1,'NONE',1,3,4,'NONE',4,4,3,'NONE',2)
)

ggplot(data=subset(a.df,group1!='NONE'), aes(x=var1)) + 
  geom_density() +
  facet_grid(. ~ group1)
ggplot(data=subset(a.df,group1=='NONE'), aes(x=var1)) + 
  geom_density()

ggplot(data=subset(a.df,group2!='NONE'), aes(x=var1)) + 
  geom_density() +
  facet_grid(. ~ group2)
ggplot(data=subset(a.df,group2=='NONE'), aes(x=var1)) + 
  geom_density()

所以我想在这里做的是:

1-首先,只需将方面划分为 2x2,而不是 4x1(我尝试使用 ncol=2,但没有用)

2-绘制第二个图 (subset(a.df,group1=='NONE')) 以及第一个图的 4 个方面中的每一个。对第 3 和第 4 做同样的事情。

3-如果可能的话,最好将 2 个结果图(4 个方面的第 1+2 个,以及 4 个方面的第 3+4 个)合二为一,但我在这里看到的问题是这些方面取决于2个分组变量...有可能吗?

所以总而言之,我觉得输入 data.frame 需要一些改造,但我不知道如何......非常感谢!

4

2 回答 2

2

在此处的这篇文章之后,向每个方面添加单个密度曲线非常简单。我认为这是你想要做的,但我可能是错的。请注意,它facet_wrap允许您选择列数,而不是facet_grid.

ggplot(data=subset(a.df,group1!='NONE'), aes(x=var1)) + 
    geom_density() +
    facet_wrap( ~ group1, ncol = 2) +
    geom_density(data=subset(a.df,group1=='NONE', var1), aes(var1, color = "NONE")) +
    scale_color_manual(name = "Baseline", values = "blue")

在将数据集融合为长格式后,为两组做同样的事情似乎相当简单,但它只适用facet_grid,因此无法控制列数。

require(reshape2)
dat2 = melt(a.df, measure.vars = c("group1", "group2"), variable.name = "group")

ggplot(data=subset(dat2, value != "NONE"), aes(x=var1)) +
    geom_density() + facet_grid(group ~ value) +
    geom_density(data=subset(dat2,value=='NONE', c(var1, group)), aes(var1), color = "blue")

我不得不使用更多的“蛮力”方法来使用 facet_wrap。本质上,我必须创建一种虚拟数据集,其中每个组的 1-4 级重复var1该类别的值。NONE查看输出以datnone获得更好的解释。希望其他人会有更好的方法来解决这个问题,因为这可能会完成工作,但肯定不是很漂亮。

datnone = cbind(dat2[dat2$value == "NONE", 2:3], 
             value = rep(1:4, each = nrow(dat2[dat2$value == "NONE",])) )

ggplot(data=subset(dat2, value != "NONE"), aes(x=var1)) +
    geom_density() + facet_wrap(group ~ value, ncol = 2) +
    geom_density(data = datnone, aes(var1), color = "blue")

编辑以添加带有两条线、两种颜色的图例

这是添加图例并同时控制linetype和的一种方法color。您还可以控制图例的名称和标签,以使其更好。

ggplot(data=subset(a.df,group1!='NONE'), aes(x=var1, color = "GROUP", linetype = "GROUP")) + 
    geom_density() +
    facet_wrap( ~ group1, ncol = 2) +
    geom_density(data=subset(a.df,group1=='NONE', var1), 
               aes(var1, color = "NONE", linetype = "NONE")) +
    scale_linetype_manual(values = c("solid", "dotted") ) +
    scale_color_manual(values = c("black", "red") )
于 2013-10-04T22:31:07.107 回答
1

这是一种避免分面并简单地将每个单独的图保存在列表中的方法,然后调用以grid.arrange获得所需的结果。

拥有同一情节的多个副本并不容易导致facet_grid. 此外,facet_grid它并不是真正为只有一个刻面变量的 2x2 绘图而设计的。

### no. levels of factor group1 not equal to 'NONE' = 4
sum(!levels(a.df$group1)=="NONE")
### define list to store results
list1 <- vector("list", 8)
### subset to remove "none"
df1 <- a.df[!a.df$group1=="NONE", ]
for (i in 1:4){
### subset per level
    df2 <- df1[df1$group1==unique(df1$group1)[i], ]
### plot and title
    g1 <- ggplot(df2, aes(x=var1)) + 
        geom_density() +
            ggtitle(unique(df1$group1)[i])
        list1[[2*i-1]] <- g1
}
### plots of NONE
df1 <- a.df[a.df$group1=="NONE", ] 
g2 <- ggplot(df1, aes(x=var1)) +
    geom_density() +
    ggtitle("NONE")
list1[[2]] <- list1[[4]] <- list1[[6]] <- list1[[8]] <- g2
### 
library(gridExtra)
do.call(grid.arrange, c(list1, list(nrow=2, ncol=4)))

给予

在此处输入图像描述

您应该能够对此进行调整,并对其他感兴趣的图执行相同的操作。

于 2013-10-04T22:28:09.680 回答