使用 R 包 pheatmap 绘制热图。有没有办法为输入矩阵中的 NA 分配颜色?似乎 NA 默认情况下被着色为白色。例如:
library(pheatmap)
m<- matrix(c(1:100), nrow= 10)
m[1,1]<- NA
m[10,10]<- NA
pheatmap(m, cluster_rows=FALSE, cluster_cols=FALSE)
谢谢
这是可能的,但需要一些黑客攻击。
首先让我们看看如何pheatmap
绘制热图。您可以通过pheatmap
在控制台中输入并滚动输出来检查,或者使用edit(pheatmap)
.
您会发现颜色是使用映射的
mat = scale_colours(mat, col = color, breaks = breaks)
该scale_colours
函数似乎是pheatmap
包的内部函数,但我们可以使用查看源代码
getAnywhere(scale_colours)
这使
function (mat, col = rainbow(10), breaks = NA)
{
mat = as.matrix(mat)
return(matrix(scale_vec_colours(as.vector(mat), col = col,
breaks = breaks), nrow(mat), ncol(mat), dimnames = list(rownames(mat),
colnames(mat))))
}
现在我们需要检查scale_vec_colours
,结果是:
function (x, col = rainbow(10), breaks = NA)
{
return(col[as.numeric(cut(x, breaks = breaks, include.lowest = T))])
}
因此,本质上pheatmap
是使用cut
来决定使用哪些颜色。
让我们尝试看看cut
如果周围有 NA 会发生什么:
as.numeric(cut(c(1:100, NA, NA), seq(0, 100, 10)))
[1] 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3
[29] 3 3 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6
[57] 6 6 6 6 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 8 9 9 9 9
[85] 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 10 NA NA
它返回 NA!所以,这是你的问题!
现在,我们如何绕过它?最简单的方法是pheatmap
绘制热图,然后根据需要对 NA 值进行叠加。
再次查看该pheatmap
函数,您会发现它使用grid
包进行绘图(另请参阅此问题:R - 如何将线条和文本添加到 pheatmap?)
因此,您可以使用grid.rect
将矩形添加到 NA 位置。我要做的是通过反复试验找到热图边界的坐标,然后从那里开始绘制矩形。
例如:
library(pheatmap)
m<- matrix(c(1:100), nrow= 10)
m[1,1]<- NA
m[10,10]<- NA
hmap <- pheatmap(m, cluster_rows=FALSE, cluster_cols=FALSE)
# These values were found by trial and error
# They WILL be different on your system and will vary when you change
# the size of the output, you may want to take that into account.
min.x <- 0.005
min.y <- 0.01
max.x <- 0.968
max.y <- 0.990
width <- 0.095
height <- 0.095
coord.x <- seq(min.x, max.x-width, length.out=ncol(m))
coord.y <- seq(max.y-height, min.y, length.out=nrow(m))
for (x in seq_along(coord.x))
{
for (y in seq_along(coord.y))
{
if (is.na(m[x,y]))
grid.rect(coord.x[x], coord.y[y], just=c("left", "bottom"),
width, height, gp = gpar(fill = "green"))
}
}
一个更好的解决方案是破解pheatmap
使用该edit
函数的代码并让它按照你的意愿处理 NA...
您可以使用来自github的开发人员版本的 pheatmap 来启用颜色分配。您可以使用 devtools 执行此操作:
#this part loads the dev pheatmap package from github
if (!require("devtools")) {
install.packages("devtools", dependencies = TRUE)
library(devtools)
}
install_github("raivokolde/pheatmap")
现在您可以在 pheatmap 函数中使用参数“na_col”:
pheatmap(..., na_col = "grey", ...)
(编辑)不要忘记之后加载它。安装后,您可以将其视为任何其他已安装的软件包。
其实,现在这个问题很简单。当前的 pheatmap 函数已包含一个用于将颜色分配给“NA”的参数 na_col。例子:
na_col = "grey90"
如果您希望 NA 为灰色,您可以简单地将“NA”强制为双倍。
m[is.na(m)] <- as.double("NA")
pheatmap(m, cluster_rows=F, cluster_cols=F)
如果您不介意使用heatmap.2
fromgplots
代替,有一个方便的na.color
论点。以上面的示例数据为例m
:
library(gplots)
heatmap.2(m, Rowv = F, Colv = F, trace = "none", na.color = "Green")