我有一个二进制分类问题。我正在尝试训练神经网络从图像中识别对象。目前我有大约 1500 张 50x50 的图像。问题是通过水平翻转的相同图像扩展我当前的训练集是否是一个好主意?(图像不是对称的)
谢谢
我有一个二进制分类问题。我正在尝试训练神经网络从图像中识别对象。目前我有大约 1500 张 50x50 的图像。问题是通过水平翻转的相同图像扩展我当前的训练集是否是一个好主意?(图像不是对称的)
谢谢
我认为你可以在更大程度上做到这一点,不仅仅是水平翻转图像,而是将图像的角度改变 1 度。这将为您的训练集中的每个实例生成 360 个样本。根据您的算法的速度,这可能是确保算法不仅经过训练以识别图像及其镜像的好方法。
这可能是一个好主意,但话又说回来,我不知道图像识别的目标或领域是什么。假设图像包含字符,并且您要求图像识别软件确定图像是否包含正斜杠/
或反斜杠\
,然后翻转图像将使您的训练数据无用。如果您的域没有遇到此类问题,那么我认为翻转它们甚至以不同程度旋转是个好主意。
我在 AdaBoost 中使用了翻转图像,并在课程中取得了巨大的成功: 来自 zip“TrainingImages.tar.gz”的http://www.csc.kth.se/utbildning/kth/kurser/DD2427/bik12/Schedule.php 。
我知道有一些关于在幻灯片中某处(在主页上)使用翻转图像的利弊的信息,但我找不到它。还有一个很好的资源是http://www.csc.kth.se/utbildning/kth/kurser/DD2427/bik12/DownloadMaterial/FaceLab/Manual.pdf(连同幻灯片)通过诸如查找不同尺度的东西和方向。
这取决于您的NN基于什么。如果您要提取旋转不变特征或不依赖于图像内空间位置的特征(如直方图或其他)并使用这些特征训练您的 NN,那么旋转将不是一个好主意。
如果您直接在像素值上进行训练,那么这可能是一个好主意。更多细节可能有用。
如果图像补丁不是对称的,我认为翻转不是一个好主意。更好的想法是对训练集进行一些相似性转换,但有一些限制。增加数据集的另一种方法是向其添加高斯平滑模板。确保正样本和负样本的数量成比例。太多的正面和太少的负面可能会扭曲分类器并在测试集上表现不佳。