0

我想对来自 Twitter 的数据进行聚类。我有用户和他们的距离。我不能使用 K-means,因为 k-means 不支持度量空间中的聚类。是否有在度量空间中进行聚类的实现?

4

2 回答 2

1

说真的,买一本关于聚类分析的书。

必须有数百种聚类算法,其中许多都适用于您具有某种相似性概念的任意空间。只要您的相似性概念良好,它们就可以对数据进行聚类。大多数时候他们失败了,你的相似性首先不起作用。

无论如何,你的问题太宽泛了,无法给你一个好的答案。您需要自己尝试这数百种算法中的一些。

于 2013-02-20T06:59:52.773 回答
1

您是否考虑过使用层次聚类来解决这个问题?

这里还有一堆关于度量空间中聚类的讲座,可能会有所帮助: Clustering Large Datasets in Arbitrary Metric Spaces

度量空间中的聚类

下面是一些java的集群包:

机器学习

平均数

层次聚类

有一个关于交叉验证的问题可能会有所帮助,他们没有使用 java,但他们提供的解决方案可能会有所帮助:Clustering with a distance matrix

于 2013-02-19T20:07:25.807 回答