cluster-analysis - SIFT 向量的分层 k 均值聚类

Question

全部

我正在寻找在http://www.wisdom.weizmann.ac.il/~bagon/CVspring07/files/scalable.pdf中应用 David Nister 和 Henrik Stewenius 的相同方法

在本文中，他们使用大量 SIFT 向量 (128-D) 作为分层 k-means 聚类的输入，以构建分层视觉词汇树。

有谁知道我可以用来进行这种聚类的任何好的库？

Ps：输入 SIFT 描述符的数量很高（70,000,000），我希望结果将是具有 1,000,000 个叶节点的词汇树。

非常感谢。问候。

score 2 · Accepted Answer

如果数据采用受支持的格式，OpenIMAJ 中的ClusterQuantiser工具应该能够做到这一点。如果该工具无法直接使用您的数据，那么您可以为org.openimaj.ml.clustering.kmeans.HierarchicalByteKMeans类（在 svn trunk 版本中）或org.openimaj.ml.clustering.kmeans.HByteKMeans1.0.5 版本中的类编写驱动程序。两个版本的类都支持来自磁盘的流式数据，因此您无需将所有功能都保存在内存中！

为了完整起见，vlfeat也有一个分层的 k-means 实现，但我不确定它的扩展程度。

根据实际经验，您还可以考虑在聚类之前对特征进行采样。我不确定你是否会从将它们全部聚类中获得很多好处。

cluster-analysis - SIFT 向量的分层 k 均值聚类

1 回答 1

Related

Reference