我使用 sklearn 高斯混合模型算法 (GMM) 对我的数据 (75000, 3) 进行了聚类。我有 4 个集群。我的数据的每个点都代表一个分子结构。现在我想得到每个簇最具代表性的分子结构,我理解的是簇的质心。到目前为止,我已经尝试使用 gmm.means_ 属性定位位于集群中心的点(结构),但是该确切点不对应于任何结构(我使用了 numpy.where)。我需要获取离质心最近的结构的坐标,但我在模块的文档中没有找到执行此操作的函数(http://scikit-learn.org/stable/modules/generated/sklearn.xml)。混合物.GaussianMixture.html)。如何获得每个集群的代表性结构?
非常感谢您的帮助,任何建议将不胜感激。
((由于这是一个通用问题,我认为没有必要添加用于聚类或任何数据的代码,如有必要请告诉我))