13

使用 R 包 pheatmap 绘制热图。有没有办法为输入矩阵中的 NA 分配颜色?似乎 NA 默认情况下被着色为白色。例如:

library(pheatmap)
m<- matrix(c(1:100), nrow= 10)
m[1,1]<- NA
m[10,10]<- NA
pheatmap(m, cluster_rows=FALSE, cluster_cols=FALSE)

谢谢

4

5 回答 5

10

这是可能的,但需要一些黑客攻击。

首先让我们看看如何pheatmap绘制热图。您可以通过pheatmap在控制台中输入并滚动输出来检查,或者使用edit(pheatmap).

您会发现颜色是使用映射的

mat = scale_colours(mat, col = color, breaks = breaks)

scale_colours函数似乎是pheatmap包的内部函数,但我们可以使用查看源代码

getAnywhere(scale_colours)

这使

function (mat, col = rainbow(10), breaks = NA) 
{
    mat = as.matrix(mat)
    return(matrix(scale_vec_colours(as.vector(mat), col = col, 
        breaks = breaks), nrow(mat), ncol(mat), dimnames = list(rownames(mat), 
        colnames(mat))))
}

现在我们需要检查scale_vec_colours,结果是:

function (x, col = rainbow(10), breaks = NA) 
{
    return(col[as.numeric(cut(x, breaks = breaks, include.lowest = T))])
}

因此,本质上pheatmap是使用cut来决定使用哪些颜色。

让我们尝试看看cut如果周围有 NA 会发生什么:

as.numeric(cut(c(1:100, NA, NA), seq(0, 100, 10)))
  [1]  1  1  1  1  1  1  1  1  1  1  2  2  2  2  2  2  2  2  2  2  3  3  3  3  3  3  3  3
 [29]  3  3  4  4  4  4  4  4  4  4  4  4  5  5  5  5  5  5  5  5  5  5  6  6  6  6  6  6
 [57]  6  6  6  6  7  7  7  7  7  7  7  7  7  7  8  8  8  8  8  8  8  8  8  8  9  9  9  9
 [85]  9  9  9  9  9  9 10 10 10 10 10 10 10 10 10 10 NA NA

它返回 NA!所以,这是你的问题!

现在,我们如何绕过它?最简单的方法是pheatmap绘制热图,然后根据需要对 NA 值进行叠加。

再次查看该pheatmap函数,您会发现它使用grid包进行绘图(另请参阅此问题:R - 如何将线条和文本添加到 pheatmap?

因此,您可以使用grid.rect将矩形添加到 NA 位置。我要做的是通过反复试验找到热图边界的坐标,然后从那里开始绘制矩形。

例如:

library(pheatmap)
m<- matrix(c(1:100), nrow= 10)
m[1,1]<- NA
m[10,10]<- NA

hmap <- pheatmap(m, cluster_rows=FALSE, cluster_cols=FALSE)
# These values were found by trial and error
# They WILL be different on your system and will vary when you change
# the size of the output, you may want to take that into account.
min.x <- 0.005
min.y <- 0.01
max.x <- 0.968
max.y <- 0.990
width <- 0.095
height <- 0.095

coord.x <- seq(min.x, max.x-width, length.out=ncol(m))
coord.y <- seq(max.y-height, min.y, length.out=nrow(m))

for (x in seq_along(coord.x))
  {
  for (y in seq_along(coord.y))
    {
    if (is.na(m[x,y]))
        grid.rect(coord.x[x], coord.y[y], just=c("left", "bottom"),
                  width, height, gp = gpar(fill = "green"))    
    }
  }

一个更好的解决方案是破解pheatmap使用该edit函数的代码并让它按照你的意愿处理 NA...

于 2014-09-19T10:26:37.173 回答
8

您可以使用来自github的开发人员版本的 pheatmap 来启用颜色分配。您可以使用 devtools 执行此操作:

#this part loads the dev pheatmap package from github
if (!require("devtools")) {
  install.packages("devtools", dependencies = TRUE)
  library(devtools)
}
install_github("raivokolde/pheatmap")

现在您可以在 pheatmap 函数中使用参数“na_col”:

pheatmap(..., na_col = "grey", ...)

(编辑)不要忘记之后加载它。安装后,您可以将其视为任何其他已安装的软件包。

于 2017-04-16T14:03:15.123 回答
7

其实,现在这个问题很简单。当前的 pheatmap 函数已包含一个用于将颜色分配给“NA”的参数 na_col。例子:

na_col = "grey90"
于 2020-07-31T23:32:31.677 回答
1

如果您希望 NA 为灰色,您可以简单地将“NA”强制为双倍。

m[is.na(m)] <- as.double("NA")
pheatmap(m, cluster_rows=F, cluster_cols=F)
于 2017-07-11T22:33:59.130 回答
1

如果您不介意使用heatmap.2fromgplots代替,有一个方便的na.color论点。以上面的示例数据为例m

library(gplots)
heatmap.2(m, Rowv = F, Colv = F, trace = "none", na.color = "Green")
于 2017-01-23T11:07:04.297 回答