1

我想将 42x42 矩阵可视化为 28 个单独的热图,每个热图都是 6x6 矩阵,其值绘制在颜色的顶部。我只需要矩阵的下半部分,我不想绘制任何被排除的东西。随后的 6x6 矩阵不应重叠,如下例所示:

d = as.matrix(read.table("http://dl.dropbox.com/u/2505196/matrix_posthoc_tukey.dat"))
d[upper.tri(d)] <- NA
d1 <- d[1:6, 1:6]
d2 <- d[1:6, 7:12]
d3 <- d[1:6, 13:18]
d4 <- d[1:6, 18:24]
#...etc, up to d28 <- d[37:42,37:42] 

我用来创建单个热图的代码如下所示:

#baseline to create a separated space for all 28 plots
par(mfrow=c(4,7), mar=c(2,2,4,1), oma=c(2,4,2,2))

#using `image` to create heatmap, with color breaks defined by specific values
#the code below create just single heatmap
image(x=1:6, y=1:6, axes = FALSE, ylab="", xlab="", d1, 
  breaks=c(min(d1,na.rm=TRUE), -5.45, -4.65, 4.65, 5.45, max(d1,na.rm=TRUE)),
  col=c("red","orange","white","orange","red"))
axis(2, 1:6, cex.axis = 0.7, las=1, tick=F)
axis(3, 1:6, cex.axis = 0.7, tick=F)
#create vertical and forizontal lines
abline(h=seq(0.5,6.5,1), v=seq(0.5,6.5,1))
#plot values from the specific matrix subset
for (i in 1:6)
   {
     for (j in 1:6)
       {
         txt <- sprintf("%0.1f", d1[i,j])
         text(i, j, txt, cex=0.7)
        }
   }

三个这样的热图如下所示:

在此处输入图像描述

这就是我卡住的地方。d每次将另一个图像添加到我的单页多热图集合时,我都必须手动更改值。我不知道如何使用上面的代码创建一个很好的循环来同时绘制这些特定的矩阵子集。

ggplot2,lattice 的替代解决方案也受到欢迎,尽管我相信这里的主要问题是制作这一系列热图的一个很好的循环。

4

3 回答 3

3

这是一个相当复杂的绘图,但它可以很容易地由 R 中的标准图形库生成。这或多或少只是跟踪哪些索引进入哪个面板的问题。提取d1d28矩阵的方式可以自动化,因此您不必写出每一行。

# Get the submatrices
I <- unlist(lapply(0:6, function(a) a:6))
J <- rep(0:6, 7:1)
d2 <- mapply(function(i,j) d[1:6+6*i, 1:6+6*j], I, J, SIMPLIFY=FALSE)

# Setup the layout and add an outer margin for the title and axis labels
layout(matrix(c(1:28, 0, 0), 5, 6))
par(oma=c(3,3,3,1), mar=c(2,2,1,1))

# Plot all the matrices oriented the same way they appear in text
# i.e. the first (vertical) dimension is plotted along the Y-axis
for(k in 1:length(d2)){
    x <- 1:6+6*J[k]
    y <- 1:6+6*I[k]

    # Heatmap & grid
    image(x, y, t(d2[[k]][nrow(d2[[k]]):1,]), las=1, axes=FALSE,
          breaks=c(-1e10, -5.45, -4.65, 4.65, 5.45, 1e10),
          col=c("red","orange","white","orange","red"))
    xg <- apply(!is.na(d2[[k]]), 2, sum)
    yg <- rev(apply(!is.na(d2[[k]]), 1, sum))
    segments(c(x[1]-1, x)+.5, min(y)-.5,
             c(x[1]-1, x)+.5, min(y)+c(6, yg)-.5, xpd=TRUE)
    segments(min(x)-.5,         c(y[1]-1, y)+.5,
             min(x)+c(6,xg)-.5, c(y[1]-1, y)+.5, xpd=TRUE)

    # X & Y-axis values
    mtext(x, 1, .1, at=x, cex=.5)
    mtext(rev(y), 2, .2, at=y, las=1, cex=.5)

    # Values of each cell
    text(rep(x, each=6), rep(rev(y), 6),
     sub("NA", "", sprintf("%.2f", d2[[k]])), cex=.3)
}

# Add title and axis labels
title("All 28 submatrices", outer=TRUE)
mtext("Columns", outer=TRUE, 1, 1)
mtext("Rows", outer=TRUE, 2, 1)

每个单元格中的数字可能很小,但如果您将其绘制为 pdf 并放大它们可以读取。函数的xpd参数segments抑制 R 将线条剪裁到绘图区域(否则外部线条会显得稍细)。

在此处输入图像描述

于 2012-10-29T08:29:03.150 回答
1

要拥有原始矩阵的 6x6 子数组,您可以执行以下操作:

for (i in seq(1, 42, 6))
    for (j in seq(i, 42, 6)) {
        dsub = d[i:(i+5), j:(j+5)]
        ...
    }

但是我建议使用更好的方法来创建热图 - 而不是重新发明它。虽然我最喜欢的用于制作普通热图的包 - 正如你想要的单元格内的数字 - 是pheatmap(=漂亮的热图),但它不支持同一页面中的多个小热图。这只是一个输出示例,您可以在安装并加载包后pheatmap()运行该函数来查看该函数的帮助。?pheatmap

在此处输入图像描述

要在同一页面中有多个热图,您可以使用ggplot2package. 以下是关于如何制作 ggplot2 热图以及在同一页面上有多个绘图的好手册。

于 2012-10-27T00:19:07.607 回答
0

我认为您只需要一个嵌套循环,并且您的 d# 必须是一个数组(我将其称为子矩阵的 subs)。请原谅我的代码,因为我并不真正了解 R,但类似以下内容:

for (row in 1:7)
  {
    for (col in 1:7)
      {
        subs[((row-1)*6)+j] <- d[ ((row-1)*6) + 1) : (row*6), (((col-1)*6) + 1) : (col*6)] 
      }
  }

这将为您提供所有 49 个子矩阵。如果您只想要前 4 列子矩阵,则可以在循环中将 col 范围从 1:4 。

于 2012-10-26T20:33:28.173 回答