scikit-learn - GridSearchCV(OneVsRestClassifier(clf, ...))：所有 N 个分类器的 1 个最佳超参数集与每个分类器的 1 个最佳超参数集

翻译自：https://stackoverflow.com/questions/33743576 2015-11-16T20:00:10.417

390 次

背景

比方说，我们有L标签来预测多类（或多标签）问题。使用OneVsRestClassifier，L正在构建分类器。假设，我们使用LogisticRegression单个分类器。

GridSearchCV当使用(resp. )搜索最优超参数时RandomizedSearchCV，我们运行：

GridSearchCV( OneVsRestClassifier( LogisticRegression(), ...) ).fit(X, y)

问题

通过运行GridSearchCV上面的命令，我们将获得一组最佳超参数，用于训练（resp. refit）所有L分类器。因此，例如，我们将获得的最佳值，并且该C=10值将用于重新拟合所有L分类器。

我的问题是为什么GridSearchCV不为每个L分类器返回一组不同的最佳超参数。例如label0，一个最优的C=10，label1将得到一个最优的C=0.01，...？为什么决定返回一组超参数，而不是为每个分类器返回一组？

以往的经验

我之所以这样问，是因为这种行为与我“手动”训练每个标签分类器时通常得到的行为不同。例如，对于某些任务，我有数千个标签要预测，我单独训练每个标签分类器（分布在许多机器上），因此我肯定会为每个标签分类器获得不同的超参数值。

0 回答 0