我已经设法使用 OpenCV 的 HOGDescriptor::compute 函数从正面和负面图像(来自 INRIA 的个人数据集)中提取 HoG 特征。
我还设法正确打包数据并将其输入 CvSVM 以进行培训。
我有几个问题:
在提取特征时,我使用尺寸为 96 x 128 的正图像,而负图像平均为 320 x 240。我一直使用 64 x 128 的窗口大小进行 HoG 提取,我应该使用其他窗口大小吗?
正图像提取的特征大小约为 28800 个特征,而负图像的特征大小约为 500000+。我一直在将特征从负数截断为 28800,我认为这是错误的,因为我相信在将这些特征提供给 SVM 时我丢失了太多信息。我应该怎么去解决这个问题?(似乎我只能为负面和正面特征提供相同的样本量)
在对大于 64 x 128(或 96 x 160)的图像进行预测时,我应该使用滑动窗口进行预测吗?由于大型负片图像仍然为我提供了超过 500000 个特征,但由于样本量,我无法将其输入 SVM。