背景
比方说,我们有L
标签来预测多类(或多标签)问题。使用OneVsRestClassifier
,L
正在构建分类器。假设,我们使用LogisticRegression
单个分类器。
GridSearchCV
当使用(resp. )搜索最优超参数时RandomizedSearchCV
,我们运行:
GridSearchCV( OneVsRestClassifier( LogisticRegression(), ...) ).fit(X, y)
问题
通过运行GridSearchCV
上面的命令,我们将获得一组最佳超参数,用于训练(resp. refit)所有L
分类器。因此,例如,我们将获得 的最佳值,并且该C=10
值将用于重新拟合所有L
分类器。
我的问题是为什么GridSearchCV
不为每个L
分类器返回一组不同的最佳超参数。例如label0
,一个最优的C=10
,label1
将得到一个最优的C=0.01
,...?为什么决定返回一组超参数,而不是为每个分类器返回一组?
以往的经验
我之所以这样问,是因为这种行为与我“手动”训练每个标签分类器时通常得到的行为不同。例如,对于某些任务,我有数千个标签要预测,我单独训练每个标签分类器(分布在许多机器上),因此我肯定会为每个标签分类器获得不同的超参数值。