3

我正在尝试使用 OnClassSVM 进行异常检测,并使用 GridSearchCV() 调整其参数,如下所示:

我已经搜索了许多网站,包括https://stackoverflow.com/,但找不到任何适合我的方案的解决方案。代码在这里:

nus = [0.001, 0.01, 0.1, 1]
gammas = [0.001, 0.01, 0.1, 1]
scorers = {
  'precision_score': make_scorer(precision_score),
  'recall_score': make_scorer(recall_score),
 'accuracy_score': make_scorer(accuracy_score)
}

tuned_parameters = {'C': [1, 10, 100, 1000], 'kernel' : ['rbf','linear'], 
'gamma' : gammas, 'nu': nus}
tuned_ocsvm = svm.OneClassSVM()
ocsvm = GridSearchCV(estimator=svm.OneClassSVM(), 
param_grid=tuned_parameters, scoring=scorers,refit='false')

但它给了我如下错误

对于多指标评分,必须将参数 refit 设置为 scorer 键或可调用函数,以在整个数据上使用最佳参数设置重新拟合估计器,并使 best_* 属性可用于该指标。如果不需要,则应将 refit 显式设置为 False。'false' 已通过

4

2 回答 2

3

GridSearchCV 的 doc中,refit定义为:

refit : boolean, string, or callable, default=True

使用整个数据集上找到的最佳参数重新拟合估计器。对于多指标评估,这需要是一个字符串,表示得分器,用于找到最后重新拟合估计器的最佳参数。在选择最佳估计器时除了最大分数之外还有其他考虑因素,可以将 refit 设置为一个函数,该函数在给定 cv_results_ 的情况下返回所选的 best_index_。重新调整的估计器在 best_estimator_ 属性中可用,并允许直接在此 GridSearchCV 实例上使用 predict。同样对于多指标评估,属性 best_index_、best_score_ 和 best_params_ 仅在设置了 refit 时才可用,并且所有这些属性都将由这个特定的记分器确定。如果 refit 是可调用的,则不会返回 best_score_。

如果您不想重新调整估算器,则可以设置refit=False(作为布尔值)。另一方面,要使用其中一个记分员重新调整估算器,您可以这样做refit='precision_score'

于 2019-09-18T06:53:46.520 回答
0

最好将您设置scorers为其中一个记分员,不要将其作为字典传递。

scorers = make_scorer(precision_score)

如果您设置refit=False,那么您将失去best_estimator_网格搜索最重要的输出之一。

于 2022-01-03T13:52:10.073 回答