0

谁能解释一下为什么分类的准确性会随着 Scikit-learn 中交叉验证的递归特征消除中使用的特征的增加而下降?从此处 Scikit-learn 文档中报告的示例:使用交叉验证的递归特征消除,似乎使用 7 个特征时产生了最佳分类结果。然而,当使用 17 个特征时,准确率下降了 25%。这怎么可能?我希望随着功能的增加,准确性会不断提高。

4

1 回答 1

1

您所指的文档版本是旧的。示例的当前版本在这里 如果删除特征总是会降低性能,那么进行特征选择就没有意义了。删除与目标无关的特征将减少过拟合。

于 2015-03-30T14:48:33.023 回答