在图像描述符的经典词袋范式中,我们:
- 为每个图像定义一组描述符
- 我们在所有图像的所有描述符集上午餐 k-means
- 结果,每个描述符都分配给一个集群
- 我们定义“视觉词”(或者换句话说,如何通过向量来表示图像):对于每张图像,我们将
i-th
“视觉词”向量的维度定义为属于i-th
集群的描述符的数量。 - 我们已经获得了一个
k-dimension
代表我们图像的“视觉词”向量。
这种方法非常适合复杂且昂贵的 SIFT 描述符……但对于二进制和快速描述符(如 Brief、ORB、BRISK 或 FREAK)是否相同?
根据这篇文章没有区别,但我想知道是否k-means
可以在二进制空间中有效地计算昂贵的算法(或者是否有更好的聚类算法),或者是否有另一种方法来使用二进制向量的词袋模型。