我试图更好地理解我的特征向量的值如何影响结果。例如,假设我有以下向量,其最终值为结果(例如,这是使用 SVC 的分类问题):
0.713, -0.076, -0.921, 0.498, 2.526, 0.573, -1.117, 1.682, -1.918, 0.251, 0.376, 0.025291666666667, -200, 9, 1
您会注意到大多数值都以 0 为中心,但是,有一个值小几个数量级,即 -200。
我担心这个值会扭曲预测并且被不公平地加权比其他值更重,仅仅是因为这个值有很大的不同。
这是创建特征向量时需要关注的问题吗?或者我使用的统计测试是否会根据我提供的训练集来评估这个大(或小)值的矢量控制?sci-kit learn 中是否有可用的方法专门用于规范化向量?
谢谢您的帮助!