1

我正在使用这个数据集:http ://www.robots.ox.ac.uk/~vgg/data/hands/

但是,我只会使用面积大于 4200 平方像素的手,这让我只有 621 只手。我意识到这可能还不够,如果需要,我会寻找更多图像。但是,所有图像都注释如下:

在此处输入图像描述

我有边界框的坐标如下: 在此处输入图像描述

但是,边界框未与 x 和 y 轴对齐。

我相信我必须从图像中剪掉手。我有两种方法可以做到这一点:

1) 令 xmin 和 xmax 为边界框的最小和最大 x 坐标。而 ymin 和 ymax 是边界框的最小和最大 y 坐标。如果这样做,我会得到这个:

在此处输入图像描述(当然,没有边界框)基本上,背景的一部分仍然在上面。

2)我可以使用二进制掩码“掩码”边界框内的所有像素。如果我这样做,我的图像大小仍然是从 xmin 到 xmax 和 ymin 到 ymax,但是我可以设置其余的背景为白色。

什么会更好?我相信正面应该只包含感兴趣的对象(在这种情况下是手),所以离开背景可能不对?但是,白色背景可以吗?

这里的主要问题是边界框没有对齐!

4

2 回答 2

0

您可能还想看看 labelme http://labelme.csail.mit.edu/Release3.0/index.php

我将它用于我的项目,他们还向您展示了如何使用 amazon turk 获取您自己的数据集。我认为您也可以使用他们的数据集。

于 2013-06-14T10:25:06.883 回答
0

留下少量背景是可以的,它在每个图像中都会有所不同,因此不会被创建为分类器的一部分。

我建议制作一个更大的负片来抵消背景,620 张图像就可以了。

于 2013-06-13T12:04:00.467 回答