2

我想用一些图像训练我的分类器,其中一些具有不同的尺寸。

它们都属于以下维度:

  • 100x50
  • 50x100
  • 64x72
  • 72x64

然而,使用 9 个方向箱和每个单元 8 个像素,每个单元生成 648 个 HoG 特征。

实际上,我将所有图像选择为其中一种尺寸,以便它们最终具有相同数量的 HoG 特征,以便训练是统一的。

我选择这个的原因是因为训练图像中感兴趣的对象有时具有不同的纵横比,因此将所有图像裁剪为相同大小,因为其中一些图像留下了太多背景。

现在我的问题是——只要 HoG 特征的数量是一致的,训练图像的纵横比/图像尺寸有什么关系?(我的训练算法只包含 HoG 特征)。

4

1 回答 1

4

如果您的 HOG 特征都使用 8x8 单元格,那么如何为不同大小的图像获得相同大小的向量?你不会在更大的图像中有更多的细胞吗?

通常,如果要使用 HOG,则应将所有图像调整为相同大小。

另一个问题:你只是想对已经裁剪的图像进行分类,还是想在大场景中检测物体?如果你只是想分类,那么纵横比的变化可能是个问题。另一方面,如果要进行滑动窗口对象检测,则纵横比的变化是一个更大的问题。您可能必须根据纵横比将您的类别分成子类,并为每个子类训练一个单独的检测器。

编辑: 对不起,但是通过使用舍入误差和纵横比差异使 HOG 向量长度相同是作弊。:) 重点是让 HOG 单元对空间信息进行编码。相应的单元格必须在不同的图像中编码相同的点。否则,您是在比较苹果和橙子。

就物体检测而言,纵横比是最重要的。您将在图像上滑动一个窗口,并且该窗口最好与您尝试检测的对象具有相同的纵横比。否则,它根本行不通。所以如果你有这 4 个不同的纵横比,你最好的办法是训练 4 个不同的检测器。

于 2014-07-11T17:50:24.487 回答