我有 7 类图像需要分类。每个类都有不同数量的样本。
- 75 张图片
- 70 张图片
- 98 张图片
- 182 张图片
- 146 张图片
- 197 张图片
- 150 张图片
我最终删除了所有类中的所有图像,减少到 70 个图像(50 个训练和 20 个验证)。使用 Keras 和生成器以及 flow_from_directory 方法,我能够对所有这些进行分类,但很明显我不会得到很好的准确性。我也有计划在以后增加数据。
我的问题是,我可以使用 flow_from_directory 方法为每个类使用不同数量的训练数据吗?这种方法有什么潜在的缺点吗?
例如 :
- 55 培训 - 20 验证
- 50 培训 - 20 验证
- 78 培训 - 20 验证
- ……
谢谢