2

像我之前的其他人一样,直方图箱的 HOG 三线性插值我正在尝试理解和实现 HoG 的三线性插值。Dalal 的论文在这里:

http://lear.inrialpes.fr/people/dalal/NavneetDalalThesis.pdf

我正在努力理解的问题是,据我所知,任务是将值重新分配到 bin 中,而不是对已知 bin 值进行插值。我很清楚方向维度中的一维情况;

例如,如果我有一个已知的像素梯度方向值75和最近的 binz1=60z2=80(bin 步长b=20),那么像素值(在这种情况下是梯度幅度,比如说w=16)将按比例分布1:3到相邻的 bin(4 到60垃圾箱和进入垃圾箱)对吗1280

当谈到需要空间插值的三维情况时,我很难过。我不明白幅度是如何重新分配到适当的垃圾箱的。对于公认的慢的人,任何明确的解释将不胜感激。

4

1 回答 1

0

Navneet Dalal 讨论的定向梯度直方图,讨论了将单元的梯度幅度插值到方向箱中(对于 0 到 180 度,我们有 9 个箱,箱步长或带宽为 20 度)

一种天真的方法是只对窗口/图像中的每个单元格执行此操作,但这会导致混叠效果。为了减少混叠,讨论了应该将图像划分为 nxn 个单元的块(最好是重叠的)。
例如。对于 64 x 128 像素的图像,您可以定义以下内容:
1. 单元大小 = 8x8 像素
2. 块大小 = 2x2 单元

这给出:
8x16 单元,或
4x8非重叠块或
7x15 块,步长为 8,即 7x15 50% 重叠块

因此,不是对每个单元格单独执行线性直方图插值,而是对块中的单元格执行三线性插值,即三线性插值:
- 双线性进入(块的)空间单元
- 线性进入方向箱

HoG 三线性插值的可视化: http ://www.ultraimg.com/d7km

于 2014-06-19T07:24:00.580 回答