2

所以我有一个包含 130000 个点的数据集,格式为 (x,y)。我的最终目标是使用 kmeans 对这些数据进行聚类。但是为了应用它,我需要找到传递给 kmeans 算法的最佳集群数量。我应该如何在 python 中应用 Gap Statistics 或 Levene 的测试来实现这一点?

4

0 回答 0