1

我正在尝试对 iris 数据集执行预处理,但在插补步骤中,使用 SimpleImputer 打印每列的平均值时出现此错误。

这是完整的代码供参考。我在最后一部分得到了错误。

import numpy as np
from sklearn.datasets import load_iris
from sklearn import preprocessing

iris = load_iris()
X = iris.data
iris_normalized = preprocessing.normalize(iris.datadata,norm='l2')
print(iris_normalized.mean(axis=0))

enc = preprocessing.OneHotEncoder()
iris_target_onehot = enc.fit_transform(iris.target.reshape(-1,1))
print(iris_target_onehot.toarray()[[0,50,100]])


X[:50,:] = np.nan
from sklearn.impute import SimpleImputer
iris_imputed = SimpleImputer(missing_values=np.nan,strategy='mean')
iris_imputed.fit_transform(X)
print(iris_imputed.mean(axis=0))


对不起,我是机器学习的新手。

4

1 回答 1

0

只需在调用平均值之前将 fit_transform 保存到 iris_imputed 即可。它会工作

iris_imputed = iris_imputed.fit_transform(iris.data)

于 2021-06-06T12:40:45.557 回答