我正在使用这个数据集:http ://www.robots.ox.ac.uk/~vgg/data/hands/
但是,我只会使用面积大于 4200 平方像素的手,这让我只有 621 只手。我意识到这可能还不够,如果需要,我会寻找更多图像。但是,所有图像都注释如下:
我有边界框的坐标如下:
但是,边界框未与 x 和 y 轴对齐。
我相信我必须从图像中剪掉手。我有两种方法可以做到这一点:
1) 令 xmin 和 xmax 为边界框的最小和最大 x 坐标。而 ymin 和 ymax 是边界框的最小和最大 y 坐标。如果这样做,我会得到这个:
(当然,没有边界框)基本上,背景的一部分仍然在上面。
2)我可以使用二进制掩码“掩码”边界框内的所有像素。如果我这样做,我的图像大小仍然是从 xmin 到 xmax 和 ymin 到 ymax,但是我可以设置其余的背景为白色。
什么会更好?我相信正面应该只包含感兴趣的对象(在这种情况下是手),所以离开背景可能不对?但是,白色背景可以吗?
这里的主要问题是边界框没有对齐!