0

我决定玩一些相似性和聚类文本。

我已经创建了相似性的 tf-idf 和 symmatrix 矩阵。现在我想实现一些聚类成组的东西。

我进行了一项研究,发现了 hcluster 和 k-means 库。

其中哪一个在准确性方面更好?即使没有现成的库,您是否知道更好的方法。如果我知道算法,我可以编写代码。

此外,这种方式是 O(n^2)。如果我想牺牲一点准确性来赢得计算时间,你有什么建议吗?

4

0 回答 0