我正在根据许多字符串句子的余弦相似度进行聚类。例如,字符串 a 和字符串 b 的余弦相似度接近于字符串 c 和字符串 b。聚类方法将以列表形式将它们组合在一起,但被组合的值是两个余弦值。
我希望在他们的分组中显示实际的字符串。但是我的聚类方法只接受余弦相似度值。有什么方法可以将它们转换回初始字符串?
MyClusters = HierarchicalClustering(List_of_cosine_values, lambda x,y: abs(x-y))
grouping = MyClusters.getlevel(0.018)