我希望可视化聚类算法的表现如何(具有一定的距离度量)。我有样本及其相应的类。为了可视化,我进行了聚类,并希望通过聚类中的项目为树状图的分支着色。颜色将是层次集群中大多数项目对应的颜色(由数据\类给出)。
示例:如果我的聚类算法选择索引 1,21,24 作为某个集群(在某个级别),并且我有一个 csv 文件,其中每一行都包含一个类号,例如 1,2,1。我希望这条边的颜色为 1。
示例代码:
require(cluster)
suppressPackageStartupMessages(library(dendextend))
dir <- 'distance_metrics/'
filename <- 'aligned.csv'
my.data <- read.csv(paste(dir, filename, sep=""), header = T, row.names = 1)
my.dist <- as.dist(my.data)
real.clusters <-read.csv("clusters", header = T, row.names = 1)
clustered <- diana(my.dist)
# dend <- colour_branches(???dend, max(real.clusters)???)
plot(dend)
编辑:另一个示例部分代码
dir <- 'distance_metrics/' # csv in here contains a symmetric matrix
clust.dir <- "clusters/" #csv in here contains a column vector with classes
my.data <- read.csv(paste(dir, filename, sep=""), header = T, row.names = 1)
filename <- 'table.csv'
my.dist <- as.dist(my.data)
real.clusters <-read.csv(paste(clust.dir, filename, sep=""), header = T, row.names = 1)
clustered <- diana(my.dist)
dnd <- as.dendrogram(clustered)