K-means聚类和向量量化有什么区别?
它们似乎非常相似。
我正在处理隐马尔可夫模型,我需要从特征向量中提取符号。
为了提取符号,我是做矢量量化还是 k-means 聚类?
K-means聚类和向量量化有什么区别?
它们似乎非常相似。
我正在处理隐马尔可夫模型,我需要从特征向量中提取符号。
为了提取符号,我是做矢量量化还是 k-means 聚类?
我理解它的方式,K-means 是一种矢量量化。
K-means 算法是著名的“Lloyd I”量化算法对经验分布情况的专门化。(参见劳埃德)
Lloyd I 算法被证明可以产生一系列具有递减二次失真的量化器。然而,除了一维对数凹分布的特殊情况外,它并不总是收敛到二次最优量化器。(量化误差有局部最小值,特别是在处理经验分布时,即聚类问题。)
一种(总是)向最优量化器收敛的方法是所谓的 CLVQ 算法,它也推广到更一般的 L^p 量化问题。它是一种随机梯度法。(参见 Pages)
还有一些基于遗传算法的方法。(参见 Hamida 等人),和/或用于收敛更快的一维情况的经典优化程序(Pagès,Printems)。