所以基本上,我使用 Python 模块scipy-cluster来绘制大量数据点。如果给定阈值或我想要的代表数量,是否有方法/功能可以给出每个集群的代表?理想情况下,每个代表必须与它所属的集群中心的距离最近。
编辑:我正在寻找每个集群中最接近质心的数据点。
所以基本上,我使用 Python 模块scipy-cluster来绘制大量数据点。如果给定阈值或我想要的代表数量,是否有方法/功能可以给出每个集群的代表?理想情况下,每个代表必须与它所属的集群中心的距离最近。
编辑:我正在寻找每个集群中最接近质心的数据点。
我真的不知道我在 scipy-cluster 周围的方式,但听起来它给了你质心坐标。鉴于该信息和集群中哪些点的知识,计算集群中每个点与质心的距离应该是微不足道的。只需确保您的计算基于用于聚类的相同距离度量(可能是欧几里德距离)。
Scipy-cluster 为每个质心提供坐标并识别每个集群中的点。一旦你有了它,我相信scipy.cluster.vq.py_vq
会给你观察和质心之间的距离。