matlab - 我应该如何为手部检测的 HAAR 训练准备正面图像？

Question

但是，我只会使用面积大于 4200 平方像素的手，这让我只有 621 只手。我意识到这可能还不够，如果需要，我会寻找更多图像。但是，所有图像都注释如下：

在此处输入图像描述

我有边界框的坐标如下：在此处输入图像描述

但是，边界框未与 x 和 y 轴对齐。

我相信我必须从图像中剪掉手。我有两种方法可以做到这一点：

1) 令 xmin 和 xmax 为边界框的最小和最大 x 坐标。而 ymin 和 ymax 是边界框的最小和最大 y 坐标。如果这样做，我会得到这个：

在此处输入图像描述（当然，没有边界框）基本上，背景的一部分仍然在上面。

2）我可以使用二进制掩码“掩码”边界框内的所有像素。如果我这样做，我的图像大小仍然是从 xmin 到 xmax 和 ymin 到 ymax，但是我可以设置其余的背景为白色。

什么会更好？我相信正面应该只包含感兴趣的对象（在这种情况下是手），所以离开背景可能不对？但是，白色背景可以吗？

这里的主要问题是边界框没有对齐！

score 0 · Accepted Answer

我将它用于我的项目，他们还向您展示了如何使用 amazon turk 获取您自己的数据集。我认为您也可以使用他们的数据集。

score 0 · Accepted Answer

留下少量背景是可以的，它在每个图像中都会有所不同，因此不会被创建为分类器的一部分。

我建议制作一个更大的负片来抵消背景，620 张图像就可以了。

2 回答 2