我有 2 个函数来标准化我的数据,例如:
def standartChanger(dataFrame):
stdSc = preprocessing.StandardScaler()
cols = dataFrame.columns
dfscaled = stdSc.fit_transform(dataFrame)
dfscaled = pd.DataFrame(dfscaled, columns=cols)
return dfscaled, stdSc
def standartChangerwithMeanVar(dataFrame,stdSc):
cols = dataFrame.columns
dataFrame = stdSc.transform(dataFrame)
dfscaled = pd.DataFrame(dataFrame, columns=cols)
return dfscaled
一个用于标准化训练,另一个用于测试。我的数据框中有一些我不想标准化的虚拟变量。现在我需要修改这些函数以不触及 0-1 的虚拟变量。我怎样才能做到这一点?
此外,在线性回归中,我有一个问题,即我的虚拟变量的系数太大,这会在预测中产生毫无意义的点。你对此有什么想法吗?