我有一个关于机器学习数据预处理的一般性问题。我知道将数据集中在 0 附近(均值减法),标准化数据(消除方差)几乎是必须做的。还有其他可能的技术。这必须用于训练数据和验证数据集。
我遇到了以下问题。我的神经网络经过训练可以对图像中的特定形状进行分类,如果我不将这种预处理技术应用于必须分类的图像,它就无法做到这一点。这种“分类”图像当然不包含在训练集或验证集中。因此我的问题是:
对必须分类的数据应用归一化是否正常,或者如果没有这种技术,我的网络性能不佳是否意味着我的模型在某种意义上是糟糕的,它无法泛化和过度拟合?
PS 在“分类”图像上使用了归一化,我的模型表现得非常好(大约 90% 的准确率),不低于 30%。
附加信息:模型:带有 keras 和 tensorflow 的卷积神经网络。