3

我正在尝试在 python 中查找使用 PANDAS 包创建的数据框的树状图。示例数据如下所示。

import numpy as np
from pandas import *
import matplotlib.pyplot as plt
from hcluster import pdist, linkage, dendrogram
from numpy.random import rand

Index= ['aaa','bbb','ccc','ddd','eee']
Cols = ['A', 'B', 'C','D']
df = DataFrame(abs(np.random.randn(5, 4)), index= Index, columns=Cols)


>>> df
            A         B         C         D
aaa  0.987415  0.192240  0.709559  0.317106
bbb  0.856932  0.252441  1.183127  0.712855
ccc  1.687198  0.462673  1.046469  0.159287
ddd  0.977152  2.657582  0.491975  0.027280
eee  0.120464  0.945034  0.142658  0.537024
>>> 

X = df.T.values #Transpose values 
Y = pdist(X)
Z = linkage(Y)
dendrogram(Z)

上面的代码生成树状图但错过了列名。我怎样才能跟踪相同的情况。

4

1 回答 1

3

正如@Wouter Overmiere 所建议的,以下内容对我有用。

X = df.T.values #Transpose values 
Y = pdist(X)
Z = linkage(Y)
dendrogram(Z, labels = df.columns)
于 2012-09-21T13:00:17.717 回答