2

我有 7 类图像需要分类。每个类都有不同数量的样本。

  1. 75 张图片
  2. 70 张图片
  3. 98 张图片
  4. 182 张图片
  5. 146 张图片
  6. 197 张图片
  7. 150 张图片

我最终删除了所有类中的所有图像,减少到 70 个图像(50 个训练和 20 个验证)。使用 Keras 和生成器以及 flow_from_directory 方法,我能够对所有这些进行分类,但很明显我不会得到很好的准确性。我也有计划在以后增加数据。

我的问题是,我可以使用 flow_from_directory 方法为每个类使用不同数量的训练数据吗?这种方法有什么潜在的缺点吗?

例如 :

  1. 55 培训 - 20 验证
  2. 50 培训 - 20 验证
  3. 78 培训 - 20 验证
  4. ……

谢谢

4

1 回答 1

0

可以,但最好使每个类中的训练样本数量相等,否则分类器可能倾向于将图像分类到训练样本最多的类中。

说,也许您可​​以将第 2 类中的训练样本加倍(通过复制和粘贴)?

对于数据增强,您可以为训练样本添加噪声,例如添加高斯噪声、裁剪和调整图像大小等。通过这样做,模型将更加健壮。

于 2017-02-15T15:53:55.983 回答