6

我正在尝试创建训练样本(并随后训练分类器)。我对createsamples 和 traincascade 中使用的-h和参数感到困惑。-w我看到的示例通常使用较小的值,但我的训练图像(负和正)要大得多(480x640),而我正在训练的对象通常占据图像的 75-100%。这些参数似乎没有询问图像的大小(它可以简单地从图像中提取),但我怀疑它也没有询问图像中对象的大小。如果我必须猜测(我宁愿不猜测),更大的尺寸可能会导致更好的检测精度,但会增加训练期间的计算量。

有人可以描述这些参数的实际含义吗?我见过的大多数示例都使用 24x24 或超过 40x40 的默认值,但据我所知从未高出多少。

4

1 回答 1

8

这些小的图像值是您要为其训练分类器的正面(对象)。真实帧中的对象可能具有任意大小,因为级联分类器适用于图像的各种比例。

是一个很好的教程,在我训练自己的分类器时帮助了我。您用于训练的裁剪图像的尺寸可能更大,但是当您运行时,createsamples您需要指定正纹理缩放的尺寸。这些新的微小样本是用于分类器的样本。这也会影响级联分类器的速度,这就是它们通常尺寸很小的原因。

如果我没记错的话,背景图像的尺寸可能会更大,但我记得我仍然将背景图像裁剪成更小的部分。

当您使用真实的 640x480 数据运行分类器时,您指定正数可以具有的最小大小的限制(当然这个值应该至少是您之前指定的 -w -h 的大小)以及最大预期大小。

haar 检测器将仅在测试图像中的窗口范围内搜索对象,该窗口范围可以任意大。

于 2013-02-28T15:01:20.940 回答