问题标签 [grid-search]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

792 问题

0 投票

1 回答

260 浏览

pandas - 如何在 scipy 中使用 gridSearch CV？

我一直在尝试使用 Gridsearchcv 调整我的 SVM，但它会抛出错误。

我的代码是：

将错误抛出为：'数组索引过多'

但是当我简单地这样做时：

代码工作正常

2016-08-09T09:23:08.370

0 投票

1 回答

2114 浏览

python - ValueError：估计器 LogisticRegression 的参数求解器无效

我正在尝试为逻辑回归运行网格搜索，但我遇到了这个非常奇怪的错误。我在我的机器上运行同样的东西，它工作正常，但是当我尝试在我的远程机器上运行它时，它失败了。

唯一明显的区别在于 python 的版本，在我的本地机器上是 2.7.10，而在它不起作用的远程机器上是 2.7.6。

以下是显然我收到错误的代码片段：

我有 2 个密集/稀疏的 numpy 数组，我正在尝试对其进行回归。

以下是我得到的回溯：

我不知道为什么会出现这个错误，我也在谷歌上搜索过，但我什至没有看到任何参数求解器无效的问题。非常感谢任何帮助。

编辑：（没有添加我列出的错误消息）

这就是我在回溯后得到的：

python numpy scikit-learn logistic-regression grid-search

2016-08-13T10:10:13.570

0 投票

1 回答

1194 浏览

python-3.x - 什么是 _passthrough_scorer 以及如何更改 GridsearchCV (sklearn) 中的计分器？

http://scikit-learn.org/stable/modules/generated/sklearn.grid_search.GridSearchCV.html（供参考）

当我使用 GridSearchCV 而不指定像那样的评分函数时， grid.scorer_ 的值是。你能解释一下 _passthrough_scorer 是什么类型的函数吗？

除此之外，我想将评分函数更改为 mean_squared_error 或其他内容。

但是行 grid.fit(x) 总是给我这个错误信息：

我无法弄清楚如何将 y_true 赋予函数，因为我不知道真实的分布。您能告诉我如何更改评分功能吗？我感谢您的帮助。

python-3.x scikit-learn scoring kernel-density grid-search

user5790923

2016-08-14T13:02:42.230

0 投票

1 回答

944 浏览

tensorflow - 无法使用 sklearn 的 GridSearchCV 运行 tflearn

我打算对 tflearn 模型的超参数执行网格搜索。似乎生成的模型tflearn.DNN与 sklearn 的 GridSearchCV 期望不兼容：

我得到错误：

知道如何获得适合 GridSearchCV 的对象吗？

tensorflow scikit-learn cross-validation grid-search tflearn

2016-08-16T06:47:09.363

0 投票

1 回答

782 浏览

machine-learning - 网格搜索中的最佳参数范围？

我想用 MLlib 运行一个简单的网格搜索实现，但我对选择“最佳”参数范围有点困惑。显然，我不想为可能不会提供改进模型的参数组合浪费太多资源。你的经验有什么建议吗？

设置参数范围：

执行网格搜索：

machine-learning apache-spark-mllib grid-search

2016-08-24T10:56:04.880

0 投票

1 回答

75 浏览

python - 无法从 python 中的 sklearn 重现 GridSearch

我正在尝试在 sklearn 中执行类似于 GridSearch 的操作：我想获取三个模型的列表，其中所有参数都是固定的，除了对应于每个模型中的 1、10 和 100 的 C。我有以下两个功能。

然后我建立一个模型并指定一个参数字典。

并使用我刚刚定义的函数生成模型。

然而，结果是相同的模型（使用最后一个参数，即 100）被重复 3 次。似乎发生了一些混叠。

python scikit-learn grid-search

2016-08-28T00:47:20.357

0 投票

1 回答

983 浏览

scikit-learn - 如果我在完成之前中断 sklearn grid_search.fit()，我可以访问当前的 .best_score_、.best_params_ 吗？

如果我在完成之前中断 grid_search.fit() 我会失去到目前为止所做的一切吗？我对网格搜索有点不知所措，并提供了一个非常大的搜索空间。我可以看到我已经满意的分数，但我的标准输出没有显示导致这些分数的参数。

我搜索了文档：http ://scikit-learn.org/stable/modules/generated/sklearn.grid_search.GridSearchCV.html

几年前有一个关于在此处添加并行搜索功能的讨论：https ://sourceforge.net/p/scikit-learn/mailman/message/31036457/

但没有什么确定的。我的搜索已经工作了约 48 小时，所以我不想丢失已发现的内容，但我也不想继续。

谢谢！

scikit-learn grid-search

2016-09-07T18:41:41.620

0 投票

2 回答

555 浏览

python - 遍历 Pandas DF 中的多个列并动态切片

TLDR：如何在不明确指定列或其值的情况下遍历 pandas 数据框中多列的所有选项？

长版：我有一个看起来像这样的 pandas 数据框，只是它的功能或药物剂量组合比这里列出的要多得多。除了 3 种类型的功能，它还可以有 70 种...：

除了我的数据框，我还有一个 python 字典，其中包含每个功能的相关范围。键是功能名称，它可以采用的不同值是键：

出于我的目的，我需要生成一个特定的组合（比如 A_dose = 1、B_dose = 90 和 C_dose = 700），并根据这些设置从我的数据框中取出相关切片，并从那个较小的子集中进行相关计算，并将结果保存在某处。

我需要为我的所有功能的所有可能组合执行此操作（远远超过这里的 3 个，并且将来会发生变化）。

在这种情况下，我可以轻松地将其弹出到 SkLearn 的参数网格中，生成选项：

并得到：

这是我遇到问题的地方：

问题 #1)我现在可以遍历all_options，但我不确定现在如何dosage_df从每个字典选项中 SELECT 出来（即 {'A_dose': 1, 'B_dose': 40, 'C_dose': 130} ) 没有明确地这样做。

在过去，我可以这样做：

但现在我不确定在括号内放什么来动态切片它......

问题#2）当我实际输入具有各自范围的完整功能字典时，我收到一个错误，因为它认为它有太多选项......

我尝试了许多替代方法，包括使用双 while 循环、从这里开始的树/递归方法、从这里开始的另一种递归方法，但它没有结合在一起......非常感谢任何帮助。

python pandas machine-learning scikit-learn grid-search

2016-09-07T20:31:18.220

0 投票

1 回答

2570 浏览

python - 为什么 GridSearchCV 返回的分数与直接运行模型返回的分数如此不同？

我使用 GridSearchCV 为套索模型找到了最佳 alpha。

我得到的最佳参数为 0.0014873521072935117，负 r2 得分为 -0.0470788758558。

然后我直接在模型上尝试了这个 alpha。我在循环中运行了以下代码。

请注意，我没有设置随机状态，因此它应该用作交叉验证。但是无论我运行代码多少次，我在这里得到的分数都在 0.11 左右（0.11-0.12）。

问题

为什么两种方法的分数 -0.0470788758558 和 0.11 如此不同？

python scikit-learn linear-regression grid-search lasso-regression

2016-09-10T22:02:45.247

0 投票

1 回答

315 浏览

python - scikit-learn GridSearchCV best_score_有什么意义

我可以在如何计算 scikit-learn GridSearchCV best_score_ 中看到答案？这个分数意味着什么。

我正在使用 scikit 学习决策树示例并尝试各种评分参数值。

每次我得到一个 diff 值 best_score_，范围从0.92到0.96。

这个分数是否应该决定我最终应该使用的评分参数值。同样在 scikit learn 网站上，我看到在分类不平衡的情况下不应该使用准确度值。

python pandas scikit-learn grid-search

2016-09-13T15:34:44.223

1 2 3 4 5 6 7 8 9 10

问题标签 [grid-search]

设置参数范围：

执行网格搜索：

Reference