-1

我正在使用 k-means 和 NGD(标准化谷歌距离)对术语进行聚类。我有一个距离矩阵作为 k-means 算法的输入。是否可以在这种情况下运行 k-means?你能建议任何源代码吗?

先感谢您,

纳斯

4

2 回答 2

1

K-means不能与距离矩阵一起使用。

因为它从不计算/使用点对点的相似性!(另外,它可以以这种方式在少于二次的时间内运行......)

相反,它计算将对象分配给集群质心的方差贡献(从技术上讲,这是欧几里得距离的平方但实际上您不应该在此处插入其他距离。)而且,由于质心移动,您不能预先计算这些距离。

但是,存在没有此限制的 k-means变体,特别是 K-medoids aka PAM(在 Wikipedia 上查找)。这些不使用聚类中心,而是使用中心点(因此得名),它们是数据集的点。

于 2013-06-12T06:19:12.487 回答
-1

好吧,您可以在这里使用 WEKA-MEANS 我发现了一些东西

您可以在这里下载项目以查看源代码

于 2013-06-11T17:15:57.857 回答