我正在尝试使用 Knn 来估算我的数据集中的缺失值。谁能建议我这个方法的概念以及如何通过在 scikit-learn 中使用 Knn 来做到这一点。
先感谢您。
我正在尝试使用 Knn 来估算我的数据集中的缺失值。谁能建议我这个方法的概念以及如何通过在 scikit-learn 中使用 Knn 来做到这一点。
先感谢您。
您可以使用 Sklearn 中的 KNN imputer,注意:仅适用于数字数据而不适用于分类,我知道是因为我尝试过分类
将 numpy 导入为 np
从 sklearn.impute 导入 KNNImputer
X = [[1, 2, np.nan], [3, 4, 3], [np.nan, 6, 5], [8, 8, 7]]
imputer = KNNImputer(n_neighbors=2)
imputer.fit_transform(X)
请转到此链接了解更多信息