0

我想使用词袋进行基于内容的图像检索。我对如何将词袋应用于基于内容的图像检索感到困惑。澄清:

我已经使用 SURF 特征训练了我的程序并提取了 BoW 描述符。我将其作为训练数据提供给支持向量机。然后,给定一张查询图像,支持向量机可以预测给定图像属于哪个类别。

换句话说,给定一个查询图像,它可以找到一个类。例如,给定汽车的查询图像,程序将返回“汽车”。如何找到相似的图像?

给定班级,我会从训练集中返回图像吗?或者程序——给定一个查询图像——也会返回一个测试集的子集,SVM 在该子集上预测相同的类?

4

1 回答 1

0

标题仅提及 BoW,但在您的文本中您也使用 SVM。

我认为 CBIR 的核心思想是,根据一些距离度量找到最相似的图像。您可以使用 BoW 功能来做到这一点。SVM 不是必需的。

使用附加分类的主要目的是加快进程。因为在您获得测试图像的类别标签后,您只需搜索该图像子组以找到最佳匹配。当然,如果 SVM 在区分某些类别方面比您的距离测量更好,它可能有助于减少错误。

所以标准的工作流程是:

  • 获取类
  • 从该类的训练样本中返回最佳匹配
于 2013-04-30T07:29:56.900 回答