0

我正在编写自己的 HoG 以供将来修改,并尝试不同的方法。但我偶然发现了这个问题/问题。

我从 INRIA 下载了数据集,其中有 320 x 240 的图像。而 HoG 的默认训练窗口大小为 64 x 128。我应该如何解决这个问题?

对于正图像,它们大约为 96 x 160 像素,我所做的是将它们的大小调整为 64 x 128。但是对于较大的图像,我是否调整它们的大小,使用逐个像素移动的滑动窗口,或者我计算该大图像中 64 x 128 块的特征?

4

1 回答 1

4

这个问题的答案完全取决于您的应用领域以及您对这些图像的了解。我以前没有玩过INRIA,但是....

1)您要查找的对象是否都大小相同,并且在所有图像中的位置都相同?那么固定大小、固定位置的 64x128 集可能就可以了。

2)您要查找的对象是否都大小相同,只是在不同图像中的不同位置?然后滑动窗口可能会起作用。

3)您是否希望对象改变大小并填充整个图像的不同百分比?然后你需要做一些事情来减轻比例和位置变化,使用图像金字塔或其他比例不变技术(你可以通过将图像调整为几个中间尺寸并运行滑动窗口版本来粗略地做到这一点每个)。

另外,这是为了训练分类器吗?如果是这样,您需要一种方法来标记适当的规模和位置,和/或解决多实例学习问题。如果你只是想跑,你需要一种方式来声明和给自己打分……

很多有趣的事情!

于 2012-10-23T01:37:44.220 回答