3

我正在训练一个级联分类器以检测图像中的动物。不幸的是,我的误报率非常高(使用 Haar 和 LBP 的误报率非常高,使用 HOG 可以接受)。我想知道如何改进我的分类器。

以下是我的问题:

  • 稳健检测所需的训练样本量是多少?我在某处读到需要 4000 个 pos 和 800 个 neg 样本。这是一个好的估计吗?
  • 训练样本应该有多大不同?有没有办法量化图像差异以包含/排除可能的“重复”数据?
  • 我应该如何处理被遮挡的物体?我应该只训练动物的可见部分,还是应该选择我的 ROI 以使平均 ROI 相当稳定?
  • 重新遮挡的物体:动物有腿、手臂、尾巴、头等。由于某些身体部位往往会经常被遮挡,选择“躯干”作为 ROI 是否有意义?
  • 我应该尝试缩小我的图像并训练更小的图像尺寸吗?这可能会改善事情吗?

我愿意在这里接受任何指示!

4

1 回答 1

7
  • 4000 pos - 800 neg 是一个糟糕的比例。负样本的问题是你需要尽可能多地训练你的系统,因为Adaboost ML 算法- 所有类似特征选择过程的核心算法 - 高度依赖于它们。使用 4000 / 10000 将是一个很好的增强。
  • 检测“动物”是一个难题。由于您的问题是一个决策过程,这已经是NP-hard,因此您的分类范围正在增加复杂性。先从猫开始。有一个检测猫的系统。然后将同样的方法应用于狗。拥有 40 个系统,检测不同的动物,然后将它们用于您的目的。
  • 对于训练,不要使用被遮挡的对象作为正例。即,如果您想检测正面,则仅应用位置和方向更改来训练正面,而不包括其前面的任何其他对象。
  • 缩小并不重要,因为 haar 分类器本身会将所有内容缩小到 24x24。当你有足够的时间时,观看整个 viola-jones 的演示。
  • 祝你好运。
于 2013-07-03T11:27:25.637 回答