我一直在尝试聚集一些更大的数据集。由 50000 个维度为 7 的测量向量组成。我正在尝试生成大约 30 到 300 个集群以进行进一步处理。
我一直在尝试以下集群实现,但没有成功:
- Pycluster.kcluster(在我的数据集上只给出 1-2 个非空集群)
- scipy.cluster.hierarchy.fclusterdata(运行时间过长)
- scipy.cluster.vq.kmeans(内存不足)
- sklearn.cluster.hierarchical.Ward(运行时间过长)
还有其他我可能会错过的实现吗?