我正在研究 python 中的 KNN 算法,并尝试使用 MinMaxScaler 标准化我的数据帧,以将数据转换为 0 到 1 之间的范围内的数据。
但是,当我返回输出时,我观察到某些列的最小/最大输出超过了 1。我用错了吗?
使用的代码是:
kdd_data_10percent = pandas.read_csv("data/kdd_10pc", header=None, names = col_names)
features = kdd_data_10percent[num_features].astype(float)#num_features contain the specific column labels i wish to extract
features.apply(lambda x: MinMaxScaler().fit_transform(x))
特征包含包含列的数据框(例如,错误片段,紧急......)。
如果我理解正确,在执行 MinMaxScaler 之后,返回的结果将确保每列值将被规范化为仅从 0 -1 的范围。我对吗?