我正在训练一个用于语义分割的 UNET,但我只有 200 个标记图像。鉴于数据集的规模较小,它肯定需要一些数据增强技术。
我对测试和验证集有疑问。
我有自定义数据生成器,它不断从文件夹中为训练模型提供数据。
所以我打算做的是:
对训练集进行数据扩充并将所有数据保存在同一个文件夹中
“随机”选择一些训练数据进入测试和验证集(当然,在训练之前)。
我不确定这是否可以,因为我们只是做了一些简单的处理(翻转、转置、调整亮度)
先分离数据然后对训练文件夹中的其余数据进行扩充会更好吗?
我正在训练一个用于语义分割的 UNET,但我只有 200 个标记图像。鉴于数据集的规模较小,它肯定需要一些数据增强技术。
我对测试和验证集有疑问。
我有自定义数据生成器,它不断从文件夹中为训练模型提供数据。
所以我打算做的是:
对训练集进行数据扩充并将所有数据保存在同一个文件夹中
“随机”选择一些训练数据进入测试和验证集(当然,在训练之前)。
我不确定这是否可以,因为我们只是做了一些简单的处理(翻转、转置、调整亮度)
先分离数据然后对训练文件夹中的其余数据进行扩充会更好吗?