3

我正在尝试检测输入向量与给定聚类中心的拟合程度。我可以很容易地找到最佳匹配(与输入向量的欧几里德距离最小的中心是最好的),但是,我现在需要研究匹配的好坏。

为此,我需要找到构成质心的向量的散布(标准差?),然后查看我的输入向量到中心的距离是否小于散布。如果它超过了传播范围,我应该可以说我没有适合它的集群(假设最好的不能很好地适合输入向量)。

我不确定如何找到每个集群的传播。我有所有的中心向量,所有的训练向量都标有它们最近的集群,我只是不能完全理解我需要做什么才能得到传播。

我希望这很清楚?如果没有,我会尝试改写它!蒂亚·伊恩

4

2 回答 2

4

使用距离函数并计算从中心点到每个标记点的距离,然后计算出这些距离的平均值。那应该给你标准偏差。

于 2010-02-23T18:32:18.507 回答
1

如果您切换到使用不同的算法,例如高斯混合,您会得到作为模型一部分的扩展(例如,标准偏差)(聚类结果)。

http://home.deib.polimi.it/matteucc/Clustering/tutorial_html/mixture.html

http://en.wikipedia.org/wiki/Mixture_model

于 2013-11-20T17:50:01.847 回答