我正在使用 Weka 尝试不同的聚类算法。当我尝试使用欧几里德距离的 SimpleKMeans 算法时,我得到的错误分类实例较少,然后当我尝试使用曼哈顿距离时,我得到更多错误分类的实例。文本聚类的最佳距离度量是什么,为什么?为什么我得到非常不同的结果?我正在使用类来集群评估集群模式。
问问题
2648 次
我正在使用 Weka 尝试不同的聚类算法。当我尝试使用欧几里德距离的 SimpleKMeans 算法时,我得到的错误分类实例较少,然后当我尝试使用曼哈顿距离时,我得到更多错误分类的实例。文本聚类的最佳距离度量是什么,为什么?为什么我得到非常不同的结果?我正在使用类来集群评估集群模式。