0

我正在训练一个用于语义分割的 UNET,但我只有 200 个标记图像。鉴于数据集的规模较小,它肯定需要一些数据增强技术。

我对测试和验证集有疑问。

我有自定义数据生成器,它不断从文件夹中为训练模型提供数据。

所以我打算做的是:

  • 对训练集进行数据扩充并将所有数据保存在同一个文件夹中

  • “随机”选择一些训练数据进入测试和验证集(当然,在训练之前)。

我不确定这是否可以,因为我们只是做了一些简单的处理(翻转、转置、调整亮度)

先分离数据然后对训练文件夹中的其余数据进行扩充会更好吗?

4

0 回答 0