Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我已经使用 Weka 对一组文本文档进行了聚类。它将相似的文档分组到一个集群中。我想测量一个集群内的文本文档如何相互接近。如何计算一个集群内的文档之间的距离。
任何人都请帮助我。我是数据挖掘的新用户。
这是我的 simpleKmeans 聚类算法代码:
EuclideanDistance Dist = weka.core.EuclideanDistance(); Double distance = Dist.distance(clusterCentroid.instance(clusterNumber), Data.instance(instaceIndex));
注意:这个距离是标准化的