我正在尝试检测输入向量与给定聚类中心的拟合程度。我可以很容易地找到最佳匹配(与输入向量的欧几里德距离最小的中心是最好的),但是,我现在需要研究匹配的好坏。
为此,我需要找到构成质心的向量的散布(标准差?),然后查看我的输入向量到中心的距离是否小于散布。如果它超过了传播范围,我应该可以说我没有适合它的集群(假设最好的不能很好地适合输入向量)。
我不确定如何找到每个集群的传播。我有所有的中心向量,所有的训练向量都标有它们最近的集群,我只是不能完全理解我需要做什么才能得到传播。
我希望这很清楚?如果没有,我会尝试改写它!蒂亚·伊恩