7

我对基于词袋的图像分类有一些疑问,我会首先告诉我我做了什么

  1. 我使用 SURF 方法从具有两个不同类别的训练图像中提取了特征,

  2. 然后我对这两个类别的特征进行了聚类。

  3. 为了将我的测试图像分类(即)测试图像属于两个类别中的哪一个。为了这个分类目的,我正在使用 SVM 分类器,但我有一个疑问,我们如何输入测试图像,我们是否必须再次从 1 到 2 执行相同的步骤,然后将其用作测试集还是存在任何其他方法,

  4. 也很高兴知道弓法的效率,

请有人给我一个澄清

4

1 回答 1

10

分类器需要测试数据的表示与训练数据具有相同的含义。因此,当您评估测试图像时,您会提取特征,然后制作与原始词汇表中的哪些单词最接近的直方图。

那是:

  1. 从整个训练集中提取特征。
  2. 将这些特征聚类到词汇表 V 中;你会得到 K 个不同的聚类中心。
  3. 将每个训练图像编码为每个词汇元素在图像中出现的次数的直方图。然后每个图像由一个长度为 K 的向量表示。
  4. 训练分类器。
  5. 给定测试图像时,提取特征。现在将测试图像表示为来自 V 的每个聚类中心最接近测试图像中的特征的次数的直方图。这又是一个长度为 K 的向量。

通过取条目的平方根来打折直方图通常也很有帮助。这近似于图像特征的更真实的模型

于 2012-12-14T15:52:52.553 回答