1

我已经设法使用 OpenCV 的 HOGDescriptor::compute 函数从正面和负面图像(来自 INRIA 的个人数据集)中提取 HoG 特征。

我还设法正确打包数据并将其输入 CvSVM 以进行培训。

我有几个问题:

  • 在提取特征时,我使用尺寸为 96 x 128 的正图像,而负图像平均为 320 x 240。我一直使用 64 x 128 的窗口大小进行 HoG 提取,我应该使用其他窗口大小吗?

  • 正图像提取的特征大小约为 28800 个特征,而负图像的特征大小约为 500000+。我一直在将特征从负数截断为 28800,我认为这是错误的,因为我相信在将这些特征提供给 SVM 时我丢失了太多信息。我应该怎么去解决这个问题?(似乎我只能为负面和正面特征提供相同的样本量)

  • 在对大于 64 x 128(或 96 x 160)的图像进行预测时,我应该使用滑动窗口进行预测吗?由于大型负片图像仍然为我提供了超过 500000 个特征,但由于样本量,我无法将其输入 SVM。

4

1 回答 1

1

为什么不能将所有补丁调整为相同大小?猪描述符取决于窗口大小、块和单元大小。你应该尝试不同的组合。使用小细胞,您可以捕捉到小细节,但您会失去一般性,反之亦然。1.) 不明白问题 2.) 使所有描述符的大小相同,从调整大小的图像中提取 hog。3.) 不明白问题

于 2012-08-14T19:03:38.423 回答