0

我正在使用胡萝卜2 对一组 500 封电子邮件进行聚类。我正在使用由胡萝卜2 提供的 BisectingKMeans 算法。在同一个数据集上,当我指定 k = 9 时,只生成 6 个,当我让它运行 8 个集群时,生成 7 个 - 但是当我给 10 个集群运行时,所有 10 个都生成。谁能帮我弄清楚这背后的原因?

4

1 回答 1

0

我查看了代码,看起来这种行为是由集群拆分例程中的错误引起的。我已经对 Carrot2 的主线进行了修复,这使得生成的集群的数量更加可预测。您可以从Carrot2 build server下载带有修复程序的二进制文件。

于 2013-06-05T18:33:33.520 回答