4

我有 2 个图,每个显示不同类型的数据(疫苗和疾病),我想提取这些图的片段以生成每个受试者的图,其中包含疫苗和疾病,根据原始颜色情节

vac
  subject age  vaccine
1     E11 1.0 DTaP-IPV
2     E11 3.0 DTaP-IPV
3     E22 1.0 DTaP-IPV
4     E22 2.0     Rota
5     E22 3.0 DTaP-IPV
6     E22 3.3     Rota

ill
  subject age       illness
1     E11 0.5 ear infection
2     E11 2.0 ear infection
3     E22 0.8         fever
4     E22 1.2         fever
5     E22 3.0 ear infection

ggplot(vac,aes(x=age,y=subject,color=vaccine))+geom_point(size=5) +
  scale_color_brewer(palette="Set1",drop = FALSE)+facet_grid(subject~.)

只有疫苗

ggplot(ill,aes(x=age,y=subject,color=illness))+geom_point(size=5) +
  scale_color_brewer(palette="Set3",drop = FALSE)+facet_grid(subject~.)

只有发烧

现在,我想要 E11 的一个图,其中有一排疫苗(以 Set1 颜色着色)和一排疾病(以 Set3 颜色着色),对于 E22 也是如此。

我有很多数据类型,大约 40 个主题,所以当然,我希望自动完成,而不是通过 illustrator 等。

我认为 gtable 是要走的路,但不确定如何提取一个方面。

非常感谢!

4

3 回答 3

1

下面的代码将vac和组合ill在一个数据框中(添加一个新变量type来区分疫苗和疾病),这将允许我们在一次调用中绘制疾病和疫苗ggplot。代码有点笨拙,但我希望它能让你更接近你正在寻找的东西。

library(RColorBrewer)
library(gridExtra)

# Combine data frames vac and ill by adding a new column 
# called "type" and changing name of the third column to "condition"
vac$type = "Vaccine"
names(vac)[3] = "condition"

ill$type = "Illness"
names(ill)[3] = "condition"

dat = rbind(vac, ill)

# Convert condition to a factor to get the levels ordered properly
dat$condition = factor(dat$condition, 
                       levels=c(unique(dat$condition[dat$type=="Vaccine"]), 
                                unique(dat$condition[dat$type=="Illness"])))

dat
   subject age     condition    type
1      E11 0.5 ear infection Illness
2      E11 2.0 ear infection Illness
3      E22 3.0 ear infection Illness
4      E22 0.8         fever Illness
5      E22 1.2         fever Illness
6      E11 1.0      DTaP-IPV Vaccine
7      E11 3.0      DTaP-IPV Vaccine
8      E22 1.0      DTaP-IPV Vaccine
9      E22 3.0      DTaP-IPV Vaccine
10     E22 2.0          Rota Vaccine
11     E22 3.3          Rota Vaccine

现在我们为每个主题生成一个图表,将每个图表放在一个列表中,然后将所有图表保存在一个 PDF 文件中。该ggplot代码的工作原理如下:

  • Facet bysubject以便我们得到带有主题 ID 的条带。
  • 分面type,以便我们获得疾病和疫苗的单独图表。
  • 使用下面创建的调色板来获得我们想要的颜色

pal1 = c(brewer.pal(n=3, name="Set1")[1:2], brewer.pal(n=3, name="Set3")[1:2])

p = list() 
for (i in unique(dat$subject)) { 
  p[[i]] = ggplot(dat[dat$subject==i,], 
                  aes(x=age, y=condition, colour=condition)) +
    geom_point(size=5) + 
    scale_color_manual(values=pal1, drop=FALSE) + 
    facet_grid(type ~ subject, scale="free") + ylab("") + 
   guides(colour=FALSE) 
}

pdf("plots.pdf", 9,5)
do.call("grid.arrange", p)  
dev.off()

这是图表: 在此处输入图像描述

于 2014-09-29T18:06:05.440 回答
1

在您在问题中创建的方面,对于不在方面中的主题,您有空行。拥有约 40 个主题,这将创建一个填充行和 39 个空行的构面,这可能不是您想要的。

另一种解决方案:

# merging the dataframes together
dat <- merge(vac, ill, by=c("subject","age"), all=TRUE, sort=TRUE)

# creating the plot
ggplot() +
  geom_point(data=dat[!is.na(dat$vaccine),], aes(x=age, y=subject, fill=vaccine), size=10, shape=22) +
  geom_point(data=dat[!is.na(dat$illness),], aes(x=age, y=subject, color=illness), size=7, shape=17) +
  scale_fill_brewer(palette="Set1") +
  scale_color_brewer(palette="Set2") +
  theme_bw()

这使: 在此处输入图像描述

于 2014-09-29T18:06:18.117 回答
1

这是一个快速解决方案,可能会帮助您朝着正确的方向前进。试一试。

require(reshape2)
require(plyr)
dat <- melt(join(vac, ill, type="full"), id.vars = c("subject", "age"), na.rm=TRUE)

ggplot(dat, aes(x=age,y=variable, color=value))+geom_point(size=5) +
  scale_color_brewer(palette="Set1",drop = FALSE)+facet_grid(subject~.)
于 2014-09-29T16:50:33.083 回答