以下kmeans聚类有什么区别吗?
a) 将图像转换为灰度并对一维特征向量执行 kmeans
b) 保留 3 个通道 RGB,并对 3D 特征向量执行 kmeans
c) 获取图像直方图并对分布进行kmeans
第一个解决方案肯定更快,但是会有区别吗?也许某些像素具有不同的 RGB,但具有相同的强度?
1) 从 RGB 到灰度的转换通常不是通过简单地平均这些值来完成的(参见灰度)。如果使用这种不寻常的方式完成,即使如此,K-means 中使用的欧几里德距离也会为您的情况 (a) 和 (b) 提供不同的距离 - 导致不同的聚类 - 正如您提到的 [编辑]。但是,由于灰度值是加权和(权重不同于 1/3),因此在 RGB 之间取欧几里得距离不同于在灰度值上取差 - 所以它们是不同的。
2)我对你的(c)并不完全清楚,但对分布执行 k-means 很奇怪。可能您的意思是使用 K-means 作为模型来拟合分布,以便识别直方图中的峰和谷?如果是这种情况,它是案例(a)本身的轻微变化。它们可能非常相似(不确定它们是否相同,可能是!)如果您将案例(c)视为案例(a)的重写,通过将平方和误差中的所有相同项分组并重写它作为乘数乘以差。[如:x1 + x2 + x1 + x3 写成 2x1 + x2 + x3]