Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在使用 k-means 和 NGD(标准化谷歌距离)对术语进行聚类。我有一个距离矩阵作为 k-means 算法的输入。是否可以在这种情况下运行 k-means?你能建议任何源代码吗?
先感谢您,
纳斯
K-means不能与距离矩阵一起使用。
因为它从不计算/使用点对点的相似性!(另外,它可以以这种方式在少于二次的时间内运行......)
相反,它计算将对象分配给集群质心的方差贡献(从技术上讲,这是欧几里得距离的平方;但实际上您不应该在此处插入其他距离。)而且,由于质心移动,您不能预先计算这些距离。
但是,存在没有此限制的 k-means变体,特别是 K-medoids aka PAM(在 Wikipedia 上查找)。这些不使用聚类中心,而是使用中心点(因此得名),它们是数据集的点。
好吧,您可以在这里使用 WEKA-MEANS 我发现了一些东西
您可以在这里下载项目以查看源代码