Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
如何计算重建误差以及在哪里可以找到有关它的信息?(我将在 K-means 算法之后计算我的数据的重建误差)
需要计算每个点到每个聚类中心点的距离。
从给定向量计算重建误差的一种方法是计算它与其表示之间的欧几里德距离。在 K-means 中,每个向量都由其最近的中心表示。
因此,在运行 k 意味着:对于每个向量,计算向量的误差作为该向量与其质心之间的欧几里得距离。将每个向量的错误加起来,你的训练集就有错误。较低的错误往往会总体上提供更好的聚类。
事实上,K-Means 算法本身就是试图优化这个度量,如果让它运行到收敛,它会找到欧几里德距离重建误差的局部最小值。