我已经用 Python 计算了一个 Jaccard 相似度矩阵。我想将最高相似度聚类到最低相似度,但是,无论我使用什么链接函数,它都会产生相同的树状图!我有一种感觉,该函数假设我的矩阵是原始数据,但我已经计算了第一个相似度矩阵。有没有办法将这个相似度矩阵传递给树状图,以便正确绘制?或者我将不得不输出矩阵并简单地使用 R 来完成。通过原始原始数据是不可能的,因为我正在计算单词的相似性。谢谢您的帮助!
这是一些代码:
SimMatrix = [[ 0.,0.09259259, 0.125 , 0. , 0.08571429],
[ 0.09259259, 0. , 0.05555556, 0. , 0.05128205],
[ 0.125 , 0.05555556, 0. , 0.03571429, 0.05882353],
[ 0. , 0. , 0.03571429, 0. , 0. ],
[ 0.08571429, 0.05128205, 0.05882353, 0. , 0. ]]
linkage = hcluster.complete(SimMatrix) #doesnt matter what linkage...
dendro = hcluster.dendrogram(linkage) #same plot for all types?
show()
如果您运行此代码,您将看到一个完全向后的树状图。无论我使用什么链接类型,它都会产生相同的树状图。这凭直觉不可能是正确的!