1

我有一个包含 379838 行和列中 13 个变量的数据框(13 个临床样本):

 >  str( df)
'data.frame':   379838 obs. of  13 variables:
  $ V1 : num  0.8146 0.7433 0.0174 0.177 0 ...
 $ V2 : num  0.7465 0.5833 0.0848 0.5899 0.0161 ...
 $ V3 : num  0.788 0.843 0.333 0.801 0.156 ...
 $ V4 : num  0.601 0.958 0.319 0.807 0.429 ...
 $ V5 : num  0.792 0.49 0.341 0.865 1 ...
 $ V6 : num  0.676 0.801 0.229 0.822 0.282 ...
 $ V7 : num  0.783 0.732 0.223 0.653 0.507 ...
 $ V8 : num  0.69 0.773 0.108 0.69 0.16 ...
 $ V9 : num  0.4014 0.5959 0.0551 0.7578 0.2784 ...
 $ V10: num  0.703 0.784 0.131 0.698 0.204 ...
 $ V11: num  0.6731 0.8224 0.125 0.6021 0.0772 ...
 $ V12: num  0.7889 0.7907 0.0881 0.7175 0.2392 ...
 $ V13: num  0.6731 0.8221 0.0341 0.4059 0 ...

我正在尝试制作一个 ggplot2 箱线图,将变量分组为三组: V1-V5 、 V6-V9 和 V10-V13 ,并为每组的变量分配不同的颜色。

我正在尝试以下代码:

    df1= as.vector(df[, c("V1", "V2", "V3","V4", "V5")])
    df2= as.vector(df[, c("V6","V7", "V8","V9")])
    df3=as.vector(df[, c( "V10","V11", "V12","V13")])
    sample= c(df1,df2,df3)

   library(reshape2)

  meltData1 <- melt(df, varnames="sample")

  str(meltData1)
 'data.frame':  4937894 obs. of  2 variables:
  $ variable: Factor w/ 13 levels "V1","V2","V3",..: 1 1 1 1 1 1 1 1 1 1 ...
  $ value   : num  0.8146 0.7433 0.0174 0.177 0 ...

   p=ggplot(data=meltData1,aes(variable,value, fill=x$sample))
   p+geom_boxplot()

这给了我白盒图。如何为三组变量分配颜色?提前谢谢了!

4

2 回答 2

3

由于未提供样本数据,因此制作了包含 13 列的新数据框,其名称为V1to V13

df<-as.data.frame(matrix(rnorm(1300),ncol=13))

借助melt()reshape2数据的功能,将数据从宽格式转换为长格式。现在数据框有两列:variablevalue

library(reshape2)
dflong<-melt(df)

向长格式sample添加了新列。在这里,我根据原始数据框中的行数和每组中的原始列数重复了名称group1, 。group2group3

dflong$sample<-c(rep("group1",nrow(df)*5),rep("group2",nrow(df)*4),rep("group3",nrow(df)*4))

新列与参数fill=一起使用以根据分组设置颜色。

library(ggplot2)
ggplot(data=dflong,aes(variable,value, fill=sample))+geom_boxplot()

在此处输入图像描述

于 2013-02-13T17:47:24.740 回答
2

这是 Didzis Elferts 的后续作品。

Objective: 将样品分成 3 个颜色组,颜色组内的色度不同。

代码的第一部分是相同的:

df<-as.data.frame(matrix(rnorm(1300),ncol=13))
library(reshape2)
dflong<-melt(df)
dflong$sample<-c(rep("group1",nrow(df)*5),rep("group2",nrow(df)*4),rep("group3",nrow(df)*4))
library(ggplot2)

现在,使用包 RColorBrewer 来选择颜色深浅

library(RColorBrewer)

按颜色类创建颜色列表

col.g <- c(brewer.pal(9,"Greens"))[5:9] # select 5 colors from class Greens
col.r <- c(brewer.pal(9,"Reds"))[6:9] # select 4 colors from class Reds
col.b <- c(brewer.pal(9,"Blues"))[6:9] # select 4 colors from class Blues
my.cols <- c(col.g,col.r,col.b)

看看选择的颜色:

image(1:13,1,as.matrix(1:13), col=my.cols, xlab="my palette", ylab="", xaxt="n", yaxt="n", bty="n")

现在使用我们创建的颜色进行绘图

ggplot(data=dflong,aes(variable,value,colour=variable))+geom_boxplot()+scale_colour_manual(values = my.cols)

在上面,使用 color 和 scale_colour_manual 命令,只有线条被着色。下面,我们使用fill和scale_fill_manual:

   ggplot(data=dflong,aes(variable,value,fill=variable))+geom_boxplot()+scale_fill_manual(values = my.cols)

这是我正在寻找的一个例子

PS我是一个完全的新手,我自己也在学习R。我认为这个问题是一个应用我刚刚学到的东西的机会。

于 2013-02-13T20:27:02.983 回答