在快速查询大型数据库中的相似图像或文本时,我阅读了很多有关词汇树的内容。但是我找不到任何关于这种词汇树是什么以及如何构建其中一个功能的好的(易于理解的)描述。
问问题
6764 次
2 回答
4
词汇树是一种进行图像检索的紧凑方法。实现该算法基本上分为三个步骤,并且高度依赖于其他计算机视觉技术,例如 SIFT 特征。
第一步是使用筛选描述符构建一个 kmeans 树。这棵树的叶子节点包含一个筛选描述符的“包”。第二步是使用您在第一步中构建的词汇树来构建图像数据库。您可以将此过程视为将图像量化为向量空间。然后第三步是针对图像数据库查询图像。当然还有一些详细的技巧,比如倒排列表等。
这是词汇树的一个很好的实现 - libvot。它基本上遵循我上面描述的三个步骤。它使用 C++11 标准多线程库来加速构建过程,因此运行速度非常快。
这是关于它的原始研究论文。这些年来,它对计算机视觉社区产生了很大的影响。
于 2015-09-17T03:20:14.353 回答
1
于 2015-09-29T13:02:24.797 回答