我正在训练一个级联分类器以检测图像中的动物。不幸的是,我的误报率非常高(使用 Haar 和 LBP 的误报率非常高,使用 HOG 可以接受)。我想知道如何改进我的分类器。
以下是我的问题:
- 稳健检测所需的训练样本量是多少?我在某处读到需要 4000 个 pos 和 800 个 neg 样本。这是一个好的估计吗?
- 训练样本应该有多大不同?有没有办法量化图像差异以包含/排除可能的“重复”数据?
- 我应该如何处理被遮挡的物体?我应该只训练动物的可见部分,还是应该选择我的 ROI 以使平均 ROI 相当稳定?
- 重新遮挡的物体:动物有腿、手臂、尾巴、头等。由于某些身体部位往往会经常被遮挡,选择“躯干”作为 ROI 是否有意义?
- 我应该尝试缩小我的图像并训练更小的图像尺寸吗?这可能会改善事情吗?
我愿意在这里接受任何指示!