问题标签 [grid-search]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
260 浏览

pandas - 如何在 scipy 中使用 gridSearch CV?

我一直在尝试使用 Gridsearchcv 调整我的 SVM,但它会抛出错误。

我的代码是:

将错误抛出为:'数组索引过多'

但是当我简单地这样做时:

代码工作正常

0 投票
1 回答
2114 浏览

python - ValueError:估计器 LogisticRegression 的参数求解器无效

我正在尝试为逻辑回归运行网格搜索,但我遇到了这个非常奇怪的错误。我在我的机器上运行同样的东西,它工作正常,但是当我尝试在我的远程机器上运行它时,它失败了。

唯一明显的区别在于 python 的版本,在我的本地机器上是 2.7.10,而在它不起作用的远程机器上是 2.7.6。

以下是显然我收到错误的代码片段:

我有 2 个密集/稀疏的 numpy 数组,我正在尝试对其进行回归。

以下是我得到的回溯:

我不知道为什么会出现这个错误,我也在谷歌上搜索过,但我什至没有看到任何参数求解器无效的问题。非常感谢任何帮助。

编辑:(没有添加我列出的错误消息)

这就是我在回溯后得到的:

0 投票
1 回答
1194 浏览

python-3.x - 什么是 _passthrough_scorer 以及如何更改 GridsearchCV (sklearn) 中的计分器?

http://scikit-learn.org/stable/modules/generated/sklearn.grid_search.GridSearchCV.html(供参考)

当我使用 GridSearchCV 而不指定像 那样的评分函数时, grid.scorer_ 的值是 。你能解释一下 _passthrough_scorer 是什么类型的函数吗?

除此之外,我想将评分函数更改为 mean_squared_error 或其他内容。

但是行 grid.fit(x) 总是给我这个错误信息:

我无法弄清楚如何将 y_true 赋予函数,因为我不知道真实的分布。您能告诉我如何更改评分功能吗?我感谢您的帮助。

0 投票
1 回答
944 浏览

tensorflow - 无法使用 sklearn 的 GridSearchCV 运行 tflearn

我打算对 tflearn 模型的超参数执行网格搜索。似乎生成的模型tflearn.DNN与 sklearn 的 GridSearchCV 期望不兼容:

我得到错误:

知道如何获得适合 GridSearchCV 的对象吗?

0 投票
1 回答
782 浏览

machine-learning - 网格搜索中的最佳参数范围?

我想用 MLlib 运行一个简单的网格搜索实现,但我对选择“最佳”参数范围有点困惑。显然,我不想为可能不会提供改进模型的参数组合浪费太多资源。你的经验有什么建议吗?

设置参数范围:

执行网格搜索:

0 投票
1 回答
75 浏览

python - 无法从 python 中的 sklearn 重现 GridSearch

我正在尝试在 sklearn 中执行类似于 GridSearch 的操作:我想获取三个模型的列表,其中所有参数都是固定的,除了对应于每个模型中的 1、10 和 100 的 C。我有以下两个功能。

然后我建立一个模型并指定一个参数字典。

并使用我刚刚定义的函数生成模型。

然而,结果是相同的模型(使用最后一个参数,即 100)被重复 3 次。似乎发生了一些混叠。

0 投票
1 回答
983 浏览

scikit-learn - 如果我在完成之前中断 sklearn grid_search.fit(),我可以访问当前的 .best_score_、.best_params_ 吗?

如果我在完成之前中断 grid_search.fit() 我会失去到目前为止所做的一切吗?我对网格搜索有点不知所措,并提供了一个非常大的搜索空间。我可以看到我已经满意的分数,但我的标准输出没有显示导致这些分数的参数。

我搜索了文档:http ://scikit-learn.org/stable/modules/generated/sklearn.grid_search.GridSearchCV.html

几年前有一个关于在此处添加并行搜索功能的讨论:https ://sourceforge.net/p/scikit-learn/mailman/message/31036457/

但没有什么确定的。我的搜索已经工作了约 48 小时,所以我不想丢失已发现的内容,但我也不想继续。

谢谢!

0 投票
2 回答
555 浏览

python - 遍历 Pandas DF 中的多个列并动态切片

TLDR:如何在不明确指定列或其值的情况下遍历 pandas 数据框中多列的所有选项?

长版:我有一个看起来像这样的 pandas 数据框,只是它的功能或药物剂量组合比这里列出的要多得多。除了 3 种类型的功能,它还可以有 70 种...:

除了我的数据框,我还有一个 python 字典,其中包含每个功能的相关范围。键是功能名称,它可以采用的不同值是键:

出于我的目的,我需要生成一个特定的组合(比如 A_dose = 1、B_dose = 90 和 C_dose = 700),并根据这些设置从我的数据框中取出相关切片,并从那个较小的子集中进行相关计算,并将结果保存在某处。

我需要为我的所有功能的所有可能组合执行此操作(远远超过这里的 3 个,并且将来会发生变化)。

在这种情况下,我可以轻松地将其弹​​出到 SkLearn 的参数网格中,生成选项:

并得到:

这是我遇到问题的地方:

问题 #1)我现在可以遍历all_options,但我不确定现在如何dosage_df从每个字典选项中 SELECT 出来(即 {'A_dose': 1, 'B_dose': 40, 'C_dose': 130} ) 没有明确地这样做。

在过去,我可以这样做:

但现在我不确定在括号内放什么来动态切片它......

问题#2)当我实际输入具有各自范围的完整功能字典时,我收到一个错误,因为它认为它有太多选项......

我尝试了许多替代方法,包括使用双 while 循环、从这里开始的树/递归方法、从这里开始的另一种递归方法,但它没有结合在一起......非常感谢任何帮助。

0 投票
1 回答
2570 浏览

python - 为什么 GridSearchCV 返回的分数与直接运行模型返回的分数如此不同?

我使用 GridSearchCV 为套索模型找到了最佳 alpha。

我得到的最佳参数为 0.0014873521072935117,负 r2 得分为 -0.0470788758558。


然后我直接在模型上尝试了这个 alpha。我在循环中运行了以下代码。

请注意,我没有设置随机状态,因此它应该用作交叉验证。但是无论我运行代码多少次,我在这里得到的分数都在 0.11 左右(0.11-0.12)。


问题

为什么两种方法的分数 -0.0470788758558 和 0.11 如此不同?

0 投票
1 回答
315 浏览

python - scikit-learn GridSearchCV best_score_有什么意义

我可以在如何计算 scikit-learn GridSearchCV best_score_ 中看到答案?这个分数意味着什么。

我正在使用 scikit 学习决策树示例并尝试各种评分参数值。

每次我得到一个 diff 值 best_score_,范围从0.920.96

这个分数是否应该决定我最终应该使用的评分参数值。同样在 scikit learn 网站上,我看到在分类不平衡的情况下不应该使用准确度值。