我一直在玩一些 SVM 实现,我想知道 - 将特征值归一化以适应一个范围的最佳方法是什么?(从 0 到 1)
假设我有 3 个特征,其值范围为:
3 - 5。
0.02 - 0.05
10-15。
如何将所有这些值转换为 [0,1] 的范围?
如果在训练期间,我将遇到的特征编号 1 的最大值是 5,并且在我开始在更大的数据集上使用我的模型后,我会偶然发现高达 7 的值?然后在转换后的范围内,它将超过 1...
如何在训练期间对值进行归一化,以考虑“野外值”超过模型在训练期间“看到”的最高(或最低)值的可能性?模型将如何对此做出反应,以及当这种情况发生时我如何使其正常工作?