2

我有一种感觉,这是一个非常简单的问题,但我无法弄清楚。

我有一小部分轨迹,我正在尝试使用 scipi hcluster 对其进行聚类。

一小组轨迹

我在这方面取得了成功

    from hcluster import linkage, dendrogram

    l = linkage(matrix)
    d = dendrogram(l)
    show()

在此处输入图像描述

但是我无法弄清楚如何将树状图分配的颜色映射回原始轨迹。树状图具有以下键 ['ivl', 'dcoord', 'leaves', 'color_list', 'icoord']。根据文档,'ivl' 是打印在图底部的一组标签,由于字体很小,这些标签无法阅读。

我试过以下

    for index, label in enumerate(d['ivl']):
        print 'trajectory #%s has color %s' % (label, d['color_list'][index])

然而,这会爆炸,因为 color_list 中的颜色比 ivl 中的标签少一种。当我查看树状图时,我可以清楚地看到 2 个绿色、2 个红色、3 个洋红色等。但是树状图告诉我其他情况

    from collections import Counter        
    Counter(d['color_list'])
    Counter({'y': 68, 'b': 18, 'm': 2, 'c': 1, 'g': 1, 'r': 1})

所以最后我的问题。这个可怕的结构是什么?我如何真正获得树状图分配给每个轨迹的颜色?

4

1 回答 1

0

我有同样的问题,找到了你的帖子。希望你现在已经找到了答案,因为它已经几个月了,但如果其他人也遇到这个问题:你可以使用函数 fcluster 来获取集群: http ://docs.scipy.org/doc/scipy/参考/生成/scipy.cluster.hierarchy.fcluster.html#scipy.cluster.hierarchy.fcluster

fcluster(Z,0.7*max(Z[:,2]),'distance')

应该将 fcluster 参数与默认的树状图参数匹配。

希望这有效!

于 2013-01-24T16:17:07.927 回答