如何向外行解释定向梯度直方图算法?
问问题
2126 次
2 回答
9
寻找像素的“梯度”就是寻找是否有一条边缘穿过该像素,该egde的方向以及该边缘的可见度。
当我们考虑边缘的方向时,我们说“定向梯度”。
“直方图”计算有多少像素具有特定方向的边缘。具有可见边缘的像素比具有软边缘的像素计数更多。
例如,如果我们在图像中有一个正方形,我们会看到 HOG 在垂直方向上有很多像素,在水平方向上计算的像素数量相同,在对角线方向上没有像素。如果我们有一个平放的矩形,水平方向的像素会比垂直方向的像素多,因为水平边缘更长。如果我们有一颗钻石,我们将计算具有对角线边缘的像素。通过这种方式,您可以仅比较直方图(每个方向有多少像素有边缘)来识别形状。
如果我们需要找到特定大小的正方形(或人脸、人或任何东西),我们将图像分成我们想要找到的正方形大小的块,并将我们获得的 HOG 与该事物的 HOG 进行比较我们正在寻找。
于 2014-01-30T17:50:26.867 回答
1
我发现Silvio 博士关于 HoG 的讲座在解释这个概念方面非常有效。我在学习自己以及向他人解释时已经习惯了这一点,并且每次都效果很好。高温高压
PS - 幻灯片的版权属于Silvio 博士和他的团队。
于 2014-01-31T19:07:36.697 回答