我有一个用于识别孟加拉语字母的简短数据集(9600
用于训练和3000
测试的数据)。班级总数:50
.
这似乎是一小部分数据。所以我试图通过ImageDataGenerator
from来扩充数据集keras.preprocessing.image
。它运作良好。
现在我正在尝试通过GAN network
生成更大的数据集来扩充数据。
我已经阅读了一些基础知识并遵循了一些教程。喜欢deeplearning4j.org 中的这个,并遵循Github中的这段代码。
但是我不知道如何生成增强数据。
也许,我错过了一些策略。有人可以告诉我用 GAN 生成数据的策略吗?
我的策略是:
- 准备
training
和test
数据集。 - 训练
Generator
和discriminator
。 - 通过生成新图像
Generator
- 试图区分图像
real
和fake
图像