3

有没有对文本文档进行聚类的有效方法?我考虑过 K-Means,但它似乎太耗时了。有人可以为我提供一种有效的方法吗?

4

2 回答 2

1

聚类算法取决于您的数据集,您想用 java 编写算法来聚类您的文档吗?,您可以使用weka而不是重新发明轮子,并在您的数据集上尝试另一种聚类算法。

于 2010-12-24T11:01:41.120 回答
1

如果 K-Means 确实可以完成这项工作,而且看起来很慢,那么为什么不尝试让它更快呢?我使用的方法是random-pausing

通常情况下,有很大的加速空间,在代码中你不会认为这是一个问题,而不改变基本算法。 这是一个例子。

于 2010-12-24T16:26:08.963 回答