2

背景

比方说,我们有L标签来预测多类(或多标签)问题。使用OneVsRestClassifierL正在构建分类器。假设,我们使用LogisticRegression单个分类器。

GridSearchCV当使用(resp. )搜索最优超参数时RandomizedSearchCV,我们运行:

GridSearchCV( OneVsRestClassifier( LogisticRegression(), ...) ).fit(X, y)

问题

通过运行GridSearchCV上面的命令,我们将获得一组最佳超参数,用于训练(resp. refit)所有L分类器。因此,例如,我们将获得 的最佳值,并且该C=10值将用于重新拟合所有L分类器。

我的问题是为什么GridSearchCV不为每个L分类器返回一组不同的最佳超参数。例如label0,一个最优的C=10label1将得到一个最优的C=0.01,...?为什么决定返回一组超参数,而不是为每个分类器返回一组?

以往的经验

我之所以这样问,是因为这种行为与我“手动”训练每个标签分类器时通常得到的行为不同。例如,对于某些任务,我有数千个标签要预测,我单独训练每个标签分类器(分布在许多机器上),因此我肯定会为每个标签分类器获得不同的超参数值。

4

0 回答 0