我正在做一个关于对医学图像进行分类的科学项目,但我没有很多数据,所以我可以先扩充数据,然后随机选择要保留的数据,然后再拆分保留的数据吗?起初,我的老师告诉我先扩充数据,然后将数据拆分为训练、验证和测试。但是我认为我提出的方法会使训练数据集与测试数据集发生冲突,这将导致准确性不切实际(太高),所以我认为我在进行数据增强后随机选择文件的方法应该有助于增强数据集彼此不要太相似,解决数据集数量不平衡的问题。
问问题
66 次
我正在做一个关于对医学图像进行分类的科学项目,但我没有很多数据,所以我可以先扩充数据,然后随机选择要保留的数据,然后再拆分保留的数据吗?起初,我的老师告诉我先扩充数据,然后将数据拆分为训练、验证和测试。但是我认为我提出的方法会使训练数据集与测试数据集发生冲突,这将导致准确性不切实际(太高),所以我认为我在进行数据增强后随机选择文件的方法应该有助于增强数据集彼此不要太相似,解决数据集数量不平衡的问题。