问题标签 [grid-search]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
430 浏览

python - GridSearchCV 类型错误

好吧,我是 python 新手,我试图对推文进行标记和阻止以创建模型,然后使用 gridsearch 找到最佳超参数,我愿意接受任何类型的反馈

这是我的代码:

这是我尝试升级的数据示例

这是错误:


感谢您的时间顺便说一句我在 Windows 10 中工作并更新了所有工具

0 投票
0 回答
1041 浏览

python - 如何从 Sklearn grid_search 中获取所有估计器,而不仅仅是最好的估计器?

我使用 grid_params 对我的训练数据运行网格搜索。最后,我想在测试数据上运行几个最佳估计器的 predict_proba 但我只能从 grid_search [ grid_search_best_estimator_.predict_proba(X) ] 中获得 best_estimator

我的问题是“如何在 scikit-learn grid_search 的不同数据上运行前 n 个估计器的 predict_proba?

0 投票
1 回答
642 浏览

python - GridSearchCV:将权重传递给记分员

我正在尝试使用 GridSearchCV 为 XGB_Classifier 找到最佳参数集。由于我的数据非常不平衡,因此必须使用权重执行拟合和评分(在 cross_validation 中),因此我必须使用自定义记分器,它将“权重”向量作为参数。但是,我找不到让 GridSearchCV 将“权重”向量传递给记分员的方法。

有一些尝试将此功能添加到网格搜索:

https://github.com/ndawe/scikit-learn/commit/3da7fb708e67dd27d7ef26b40d29447b7dc565d7

但是它们没有合并到 master 中,现在恐怕此代码与上游更改不兼容。

有没有人遇到过类似的问题,有什么“简单”的方法可以解决吗?

0 投票
1 回答
740 浏览

python - Python TypeError:预期范围()整数结束参数,得到浮点数。具有拟合功能

我对此很陌生,并且看到其他人有同样的错误,但看不到我如何实施解决方案。我正在尝试使用来自 scikit learn 的随机网格搜索来编写随机森林机器学习方法。它适用于标准网格搜索,但当我使用随机网格搜索时,scikit learn 的拟合函数出现奇怪错误而失败。关于如何解决这个问题的任何建议都会很棒

这是显示错误的示例。

给出的错误如下

起初我以为我只是错过了一个参数,但这种直接网格搜索的精确方法似乎没有问题。代码如下。任何人都可以向我建议是什么导致了这个错误?

0 投票
1 回答
3369 浏览

python - 管道中的网格搜索

我正在使用GridSearchCVScikit 搜索管道中的参数。我让我的代码工作,但如果我想添加class_weights,我会碰壁。

如何将此参数添加到 GridSearch 的正确方法是什么?

0 投票
0 回答
680 浏览

python - mean_validation_score 与 numpy.mean(cv_validation_scores)

我正在使用 scikit-learn 中的 GridSearchCV 来比较几个具有不同超参数设置的模型。

根据API 文档,给定一个特定的参数网格,我可以访问其对应的命名元组grid_scores_,它又具有以下三个属性:

  • 参数:参数设置的字典
  • mean_validation_score:交叉验证折叠的平均分数
  • cv_validation_scores:每个折叠的分数列表

但是,我注意到mean_validation_score的值与我明确计算所有交叉验证分数的平均值时得到的值不完全匹配,执行如下操作:

两个平均值之间的差异并不大;实际上它在 0.0001 的数量级,因此它最终不应影响最终结果。不过,我很想知道你们中是否有人确切地知道为什么会发生这种情况。

作为一个勇敢的猜测,我会说这必须处理 scikit-learn 内部使用的浮点精度之间的一些差异,当它对mean_validation_score进行赋值时,以及当我通过 numpy显式计算所有cv_validation_scores的平均值时使用的浮点精度。

在这方面,我还通过查看 grid_search.py​​ Git存储库检查了源代码级别发生的情况,但我没有得到答案。

谢谢你的帮助!

0 投票
10 回答
68637 浏览

python - 如何从 GridSearchCV 绘制网格分数?

我正在寻找一种从 sklearn 中的 GridSearchCV 绘制 grid_scores_ 的方法。在这个例子中,我试图网格搜索 SVR 算法的最佳 gamma 和 C 参数。我的代码如下所示:

在我运行代码并打印网格分数后,我得到以下结果:

我想根据 gamma 和 C 参数可视化所有分数(平均值)。我试图获得的图表应如下所示:

在此处输入图像描述

其中 x 轴是 gamma,y 轴是平均分数(本例中的均方根误差),不同的线代表不同的 C 值。

0 投票
0 回答
1003 浏览

python - 具有多个评分功能的 GridSeachCV?

根据您传递给 GridSearchCV 的评分函数,grid.best_estomator_ 的结果可能会有所不同。我想知道是否可以在 sklearn 中运行单个 GridSearch 并在输出中获得多个分数(或评分函数的真实值)?就像是:

并且作为输出得到:

这个想法是在模型超参数的每个组合中为每个评估指标获得一个分数。假设我有 10 个不同的 GridSearchCV 评分函数。运行 GridSearchCV 10 次以查看哪些模型参数最适合每个评分函数将非常耗时。这个想法是只运行一次并为 grid_scores_ 中的每个评分函数获取一个数字(分数)

似乎它几乎在 2015 年实现到 sklearn,不幸的是该项目从未完成:https ://github.com/scikit-learn/scikit-learn/pull/2759 我正在寻找一种方法自己的。

0 投票
1 回答
9510 浏览

python - 如何在 python 中对 xgboost 执行网格搜索?

我有一些分类问题,我想在其中使用 xgboost。我有以下内容:

我正在测试它的日志丢失:

我正在尝试通过以下方式执行网格搜索:

但我得到不同的结果。网格搜索现在是否计算日志损失,作为交叉验证?

0 投票
1 回答
1682 浏览

scikit-learn - 即使网格只是一个点,带有 skflow/TF 学习的 Gridsearchcv 也会永远运行

我正在尝试对 DNN 回归的步骤、learning_rate 和 batch_size 进行网格搜索。我尝试使用简单的示例来做到这一点,这里显示的波士顿数据集boston example但是,我无法让它工作。它不会抛出任何错误,它只是运行、运行和运行。即使我设置了一个单点网格,它也会这样做。您在下面看到任何错误吗?我错过了一些明显的东西吗?我对 sklearn 和 skflow 都是新手(我知道,skflow 已经合并到 Tensorflow Learn,但我认为示例应该相同),但我只是结合了我找到的示例。

谢谢你的帮助!!