2

我已经使用 Weka 对一组文本文档进行了聚类。它将相似的文档分组到一个集群中。我想测量一个集群内的文本文档如何相互接近。如何计算一个集群内的文档之间的距离。

任何人都请帮助我。我是数据挖掘的新用户。

4

1 回答 1

0

这是我的 simpleKmeans 聚类算法代码:

EuclideanDistance Dist = weka.core.EuclideanDistance();
Double distance = Dist.distance(clusterCentroid.instance(clusterNumber), Data.instance(instaceIndex));

注意:这个距离是标准化的

于 2016-12-07T12:41:10.390 回答