0

我正在尝试使用我的数据集中指定的行名来标记我的树状图。

我正在使用包:带有以下代码的 hybridHclust。

样本表(DATASET,我希望我使用的是正确的格式)

  UID Condition1 Condition2 Condition3
1 Gene1 0.46 0.47 -0.02
2 Gene2 0.8 0.93 0.08
3 Gene3 0.45 0.89 1.04

DATASET_1 <- DATASET[,-1] # removes UID column which is not needed
  Gene Condition1 Condition2 Condition3

现在我删除了原始 excel 工作表所需的 UID 列,但聚类分析不需要:

  Condition1 Condition2 Condition3
1 0.46 0.47 -0.02
2 0.8 0.93 0.08
3 0.45 0.89 1.04

DATASETMatrix <- as.matrix.data.frame(DATASET_2) # converts df to matrix
DATASETMatrix_R <- t(DATASETMatrix) #flips along diagonal for clustering

现在桌子是

             v1 v2 v3
Condition1 0.46 0.8 0.45
Condition2 0.47 0.93 0.89
Condition3 -0.02 0.08 1.04

并且行号名称 (1, 2, 3) 在 R studio 中消失并替换为列出的条件。

DATASETClust <- as.dendrogram((eisenCluster(DATASETMatrix_R, method = "uncentered.correlation",
                                        compatible = TRUE)), hang = -0.1) #uses uncentered Pearson correlation which is not present in hclust

library(dendextend)
DATASETClust %>% set("labels_cex", 0.25) %>% 
plot(horiz = T) # got his from somewhere online

在此处输入图像描述 当我运行它时,我将行号作为树形图上的标签,但我需要行名称(Conition1、Condition2、Condition3)并且它们需要对应于它们各自的数据(不应该只是按数字顺序)。这可能还不错,但我的实际数据集有 400 多个条件进行比较,每个条件有 4000 多个变量,并且列表将继续增长,因此手动输入名称是不可行的。

谢谢大家,我欢迎在发布到本网站时反馈任何格式问题。

4

1 回答 1

1

您可以使用包dendextend更改DATASETClust(类树状图的对象)的标签(名称)。

在此处查看使用示例

于 2017-08-21T12:54:26.570 回答