缩放转换具有不同值的不同列,例如标准缩放器,但是在从中构建模型时,先前不同的值将转换为均值 = 0 和标准 = 1 的相同值,因此它应该会影响模型拟合和结果。
我采用了一个玩具熊猫数据框,第一列从 1 到 10 开始,第二列从 5 到 14 开始,并使用标准缩放器进行缩放。
import pandas as pd
ls1 = np.arange(1,10)
ls2 = np.arange(5,14)
before_scaling= pd.DataFrame()
before_scaling['a'] = ls1
before_scaling['b'] = ls2
'''
a b
0 1 5
1 2 6
2 3 7
3 4 8
4 5 9
5 6 10
6 7 11
7 8 12
8 9 13
'''
from sklearn.preprocessing import StandardScaler,MinMaxScaler
ss = StandardScaler()
after_scaling = pd.DataFrame(ss.fit_transform(before_scaling),columns=
['a','b'])
'''
a b
0 -1.549193 -1.549193
1 -1.161895 -1.161895
2 -0.774597 -0.774597
3 -0.387298 -0.387298
4 0.000000 0.000000
5 0.387298 0.387298
6 0.774597 0.774597
7 1.161895 1.161895
8 1.549193 1.549193
'''
如果要使用上述 2 个自变量构建回归模型,那么我相信拟合模型(线性回归)将使用 before_scaling 和 after_scaling 数据帧上的数据帧产生不同的拟合和结果。如果是,那么我们为什么要使用特征缩放,如果我们在单个列上一一使用特征缩放,那么它也会产生相同的结果