我有一个用于识别孟加拉语字母的简短数据集(9600用于训练和3000测试的数据)。班级总数:50.
这似乎是一小部分数据。所以我试图通过ImageDataGeneratorfrom来扩充数据集keras.preprocessing.image。它运作良好。
现在我正在尝试通过GAN network生成更大的数据集来扩充数据。
我已经阅读了一些基础知识并遵循了一些教程。喜欢deeplearning4j.org 中的这个,并遵循Github中的这段代码。
但是我不知道如何生成增强数据。
也许,我错过了一些策略。有人可以告诉我用 GAN 生成数据的策略吗?
我的策略是:
- 准备
training和test数据集。 - 训练
Generator和discriminator。 - 通过生成新图像
Generator - 试图区分图像
real和fake图像
