4

我正在尝试以与使用包“ape”绘制树时相同的“样式”绘制凝聚聚类(带有 Agnes 的 UPGMA)的结果。我在下图中包含了一个简单的示例 图 1. 所需最终输出的简单示例

关键问题是我希望能够根据叶子标签中的 a 模式为树状图的叶子着色。我尝试了两种方法:要么我使用,要么hc2Newick使用 Joris Meys 在Change Dendrogram Leaves 的答案中提出的代码。两者都没有给出令人满意的输出。可能是我也不完全理解树状图的构建方式。abundance.agnes.ave可以在https://www.dropbox.com/s/gke9qnvwptltkky/abundance.agnes.ave上找到对象的 ASCII 保存(从运行 agnes 中存储) 。

当我使用第一个选项(hc2Newick 来自 bioconductor 的ctc包)时,我在使用此代码时得到下图:

write(hc2Newick(as.hclust(abundance.agnes.ave)),file="all_samples_euclidean.tre")
eucltree<-read.tree(file="all_samples_euclidean.tre")
eucltree.laz<-ladderize(eucltree,FALSE)
tiplabs<-eucltree$tip.label
numbertiplabs<-length(tiplabs)
colourtips<-rep("green",numbertiplabs)
colourtips[grep("II",tiplabs)]<-"red"
plot(eucltree.laz,tip.color=colourtips,adj=1,cex=0.6,use.edge.length=F)
add.scale.bar()

使用 plot.phylo

这显然不理想,情节的“对齐”不是我想要的。我想这与分支长度计算有关,但是我不知道如何解决这个问题。当然,与 colLab 函数的结果相比,它看起来更像是我想要报告的树状图样式。此外,use.edge.length=T在上面的代码中使用确实会给出一个未正确“对齐”的聚类: 具有分支长度的 Plot.phylo

使用 Joris Meys 的 colLab 函数和以下代码的第二种方法给出了下图

clusDendro<-as.dendrogram(as.hclust(abundance.agnes.ave))
labelColors<-c("red","green")
clusMember<-rep(1,length(rownames(abundance.x)))
clusMember[grep("II",rownames(abundance.x))]<-2
names(clusMember)<-rownames(abundance.x)

colLab <- function(n)
{
  if(is.leaf(n)) {
    a <- attributes(n)
    # clusMember - a vector designating leaf grouping
    # labelColors - a vector of colors for the above grouping
    labCol <- labelColors[clusMember[which(names(clusMember) == a$label)]]
    attr(n, "nodePar") <- c(a$nodePar, lab.col = labCol)
  }
  n
}

clusDendro<-dendrapply(clusDendro, colLab)
plot(clusDendro,horiz=T,axes=F)

使用 colLab 这个情节越来越接近我想要的,但是我不知道为什么叶子上会出现空心圆圈以及如何去除它们。

任何帮助深表感谢。

亲切的问候,

调频

4

2 回答 2

2

这个功能现在可以在一个名为“ dendextend ”的新包中使用,它正是为这种事情而构建的。

您可以在以下 URL 的“使用”部分中的演示文稿和小插图中看到许多示例:https ://github.com/talgalili/dendextend

在以下 SO 问题中刚刚回答了一个几乎完全正确的问题:

https://stackoverflow.com/a/18832457/256662

于 2013-09-16T16:10:18.333 回答
0

我很久以前写过这段代码,看起来机制上有些改变。

我使用的plot.dendrogram函数有一个参数nodePar。自从我上次使用该函数以来,行为发生了变化,虽然这通常用于内部节点,但它显然也会对外部节点产生影响。根据帮助文件,pch默认值为now。1:2

因此,您需要pch=NA在添加到colLab函数外部节点的属性中具体指定。尝试像这样调整它:

colLab <- function(n)
{
  if(is.leaf(n)) {
    a <- attributes(n)
    # clusMember - a vector designating leaf grouping
    # labelColors - a vector of colors for the above grouping
    labCol <- labelColors[clusMember[which(names(clusMember) == a$label)]]

    attr(n, "nodePar") <- 
        if(is.list(a$nodePar)) c(a$nodePar, lab.col = labCol,pch=NA) else
                               list(lab.col = labCol,pch=NA)
  }
  n
}

在我的机器上,这解决了问题。

或者,您可以查看包use.edge.length中函数plot.phylo的参数ape。您将其设置为FALSE,但根据您的解释,我相信您希望将其设置为默认值,TRUE.

编辑:为了使函数更通用,添加labelColorsclusMember作为函数的参数可能是一个好主意。我的 quick-n-dirty 解决方案不是干净代码的最佳示例......

也忘记我所说的使用边缘长度。猿包将其解释为真正的树状图,并且将use.edge.length边缘TRUE长度转换为进化时间。因此,树状图的“奇怪”轮廓。

另请注意,如果树叶没有nodePar属性,使用该函数添加额外参数c()将导致不良效果:如果添加 eg lab.cex=0.6,该c()函数将创建一个向量而不是列表,并在lab.cex任何时候将值转换为字符参数列表中有一个字符值。在这种情况下,这将是颜色的名称,这解释了您在评论中谈到的错误。

于 2013-04-19T15:20:16.893 回答