HOG 在人体检测中很受欢迎。例如,它可以用于检测图像中的杯子等物体吗?
我很抱歉没有问编程问题,但我的意思是我是否可以使用 hog 来提取对象特征。
根据我的研究,我已经有几天没有感觉了,但我不确定。
HOG 在人体检测中很受欢迎。例如,它可以用于检测图像中的杯子等物体吗?
我很抱歉没有问编程问题,但我的意思是我是否可以使用 hog 来提取对象特征。
根据我的研究,我已经有几天没有感觉了,但我不确定。
是的,HOG (定向梯度直方图)可用于检测任何类型的对象,对于计算机而言,图像是一堆像素,无论其内容如何,您都可以提取特征。不过,另一个问题是这样做的有效性。
HOG、SIFT和其他此类特征提取器是用于从图像中提取相关信息以更有意义的方式对其进行描述的方法。当您想检测具有数千(甚至数百万)像素的图像中的对象或人时,简单地将具有数百万个数字的向量输入机器学习算法是低效的
具体来说,HOG 算法从图像中的某些块创建边缘方向的直方图。补丁可能来自一个物体、一个人、无意义的背景或其他任何东西,它只是一种使用边缘信息来描述一个区域的方式。如前所述,此信息可用于输入机器学习算法,例如经典支持向量机,以训练能够区分一种对象与另一种对象的分类器。
HOG 在行人检测方面取得如此成功的原因是,一个人的肤色、服装和其他因素可能会有很大差异,但行人的一般边缘保持相对恒定,尤其是在腿部周围。这并不意味着它不能用于检测其他类型的对象,但它的成功可能会因您的特定应用程序而异。HOG 论文详细展示了这些描述符如何用于分类。
值得注意的是,对于几个应用程序,使用金字塔方案可以大大提高 HOG 获得的结果。其工作原理如下:您可以连续将图像(或补丁)划分为多个子图像,而不是从图像中提取单个 HOG 向量,从每个较小的部分中提取一个单独的 HOG 向量。然后可以重复该过程。最后,您可以通过将所有 HOG 向量连接成一个向量来获得最终描述符,如下图所示。
这样做的好处是,在较大的尺度上,HOG 特征提供了更多的全局信息,而在较小的尺度上(即在较小的细分中),它们提供了更细粒度的细节。缺点是最终的描述符向量变得更大,因此需要更多时间来提取和使用给定的分类器进行训练。
简而言之:是的,您可以使用它们。