1

我正在使用 OpenCV 的 HOG 实现提取灰度图像的 HOG 特征。假设我的图像与默认窗口大小(即 128x64)匹配,我很难正确理解该特征向量是如何组织的。这是我所知道的:

  • 每个单元格输出一个 9 个元素的直方图,量化位于该单元格内的边缘的方向(默认为 8x8 像素)。
  • 每个块包含 2x2 单元格。
  • 默认情况下,使用 8x8 块步长。

这导致 7*15*9*4 = 3780 个元素的特征向量。图 7 和 15 是使用 50% 块重叠时水平和垂直适合的块数。一切都很好,直到这里。

如果我们检查第一个块的特征,即前 9*4 个元素,它们是如何排列的?前 9 个 bin 是否对应于块中左上角的单元格?接下来的9个呢?和下一个?9 个 bin 中的每一个代表哪个方位角?bins[0] = 0, bins[1] = 20, bins[2] = 40, ... bins[8] = 160. 还是顺序不同,例如从 -pi/2 到 +pi/ 2?

4

0 回答 0