为什么我的集群中有重叠?是因为 sklearn.KMeans 过早完成迭代吗?图:kmeans簇萼片鸢尾花
一些说明:
- 数据是 4D,值是标准化的(@OmG 指出了我的问题的答案)
- 我在这里上传了 3 个文件:github 存储库
- code.py - minimum for this question
- code_notebook.ipynb same as code.py + other functions
- iris-dataset.csv : the dataset
因为我正在处理的示例总是只绘制前 2 列,所以我认为我只在这两个变量上运行聚类。感谢您指出问题的答案!