问题标签 [grid-search]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pandas - 如何在 scipy 中使用 gridSearch CV?
我一直在尝试使用 Gridsearchcv 调整我的 SVM,但它会抛出错误。
我的代码是:
将错误抛出为:'数组索引过多'
但是当我简单地这样做时:
代码工作正常
python - ValueError:估计器 LogisticRegression 的参数求解器无效
我正在尝试为逻辑回归运行网格搜索,但我遇到了这个非常奇怪的错误。我在我的机器上运行同样的东西,它工作正常,但是当我尝试在我的远程机器上运行它时,它失败了。
唯一明显的区别在于 python 的版本,在我的本地机器上是 2.7.10,而在它不起作用的远程机器上是 2.7.6。
以下是显然我收到错误的代码片段:
我有 2 个密集/稀疏的 numpy 数组,我正在尝试对其进行回归。
以下是我得到的回溯:
我不知道为什么会出现这个错误,我也在谷歌上搜索过,但我什至没有看到任何参数求解器无效的问题。非常感谢任何帮助。
编辑:(没有添加我列出的错误消息)
这就是我在回溯后得到的:
python-3.x - 什么是 _passthrough_scorer 以及如何更改 GridsearchCV (sklearn) 中的计分器?
http://scikit-learn.org/stable/modules/generated/sklearn.grid_search.GridSearchCV.html(供参考)
当我使用 GridSearchCV 而不指定像 那样的评分函数时, grid.scorer_ 的值是 。你能解释一下 _passthrough_scorer 是什么类型的函数吗?
除此之外,我想将评分函数更改为 mean_squared_error 或其他内容。
但是行 grid.fit(x) 总是给我这个错误信息:
我无法弄清楚如何将 y_true 赋予函数,因为我不知道真实的分布。您能告诉我如何更改评分功能吗?我感谢您的帮助。
tensorflow - 无法使用 sklearn 的 GridSearchCV 运行 tflearn
我打算对 tflearn 模型的超参数执行网格搜索。似乎生成的模型tflearn.DNN
与 sklearn 的 GridSearchCV 期望不兼容:
我得到错误:
知道如何获得适合 GridSearchCV 的对象吗?
machine-learning - 网格搜索中的最佳参数范围?
我想用 MLlib 运行一个简单的网格搜索实现,但我对选择“最佳”参数范围有点困惑。显然,我不想为可能不会提供改进模型的参数组合浪费太多资源。你的经验有什么建议吗?
设置参数范围:
执行网格搜索:
python - 无法从 python 中的 sklearn 重现 GridSearch
我正在尝试在 sklearn 中执行类似于 GridSearch 的操作:我想获取三个模型的列表,其中所有参数都是固定的,除了对应于每个模型中的 1、10 和 100 的 C。我有以下两个功能。
然后我建立一个模型并指定一个参数字典。
并使用我刚刚定义的函数生成模型。
然而,结果是相同的模型(使用最后一个参数,即 100)被重复 3 次。似乎发生了一些混叠。
scikit-learn - 如果我在完成之前中断 sklearn grid_search.fit(),我可以访问当前的 .best_score_、.best_params_ 吗?
如果我在完成之前中断 grid_search.fit() 我会失去到目前为止所做的一切吗?我对网格搜索有点不知所措,并提供了一个非常大的搜索空间。我可以看到我已经满意的分数,但我的标准输出没有显示导致这些分数的参数。
我搜索了文档:http ://scikit-learn.org/stable/modules/generated/sklearn.grid_search.GridSearchCV.html
几年前有一个关于在此处添加并行搜索功能的讨论:https ://sourceforge.net/p/scikit-learn/mailman/message/31036457/
但没有什么确定的。我的搜索已经工作了约 48 小时,所以我不想丢失已发现的内容,但我也不想继续。
谢谢!
python - 遍历 Pandas DF 中的多个列并动态切片
TLDR:如何在不明确指定列或其值的情况下遍历 pandas 数据框中多列的所有选项?
长版:我有一个看起来像这样的 pandas 数据框,只是它的功能或药物剂量组合比这里列出的要多得多。除了 3 种类型的功能,它还可以有 70 种...:
除了我的数据框,我还有一个 python 字典,其中包含每个功能的相关范围。键是功能名称,它可以采用的不同值是键:
出于我的目的,我需要生成一个特定的组合(比如 A_dose = 1、B_dose = 90 和 C_dose = 700),并根据这些设置从我的数据框中取出相关切片,并从那个较小的子集中进行相关计算,并将结果保存在某处。
我需要为我的所有功能的所有可能组合执行此操作(远远超过这里的 3 个,并且将来会发生变化)。
在这种情况下,我可以轻松地将其弹出到 SkLearn 的参数网格中,生成选项:
并得到:
这是我遇到问题的地方:
问题 #1)我现在可以遍历all_options
,但我不确定现在如何dosage_df
从每个字典选项中 SELECT 出来(即 {'A_dose': 1, 'B_dose': 40, 'C_dose': 130} ) 没有明确地这样做。
在过去,我可以这样做:
但现在我不确定在括号内放什么来动态切片它......
问题#2)当我实际输入具有各自范围的完整功能字典时,我收到一个错误,因为它认为它有太多选项......
我尝试了许多替代方法,包括使用双 while 循环、从这里开始的树/递归方法、从这里开始的另一种递归方法,但它没有结合在一起......非常感谢任何帮助。
python - 为什么 GridSearchCV 返回的分数与直接运行模型返回的分数如此不同?
我使用 GridSearchCV 为套索模型找到了最佳 alpha。
我得到的最佳参数为 0.0014873521072935117,负 r2 得分为 -0.0470788758558。
然后我直接在模型上尝试了这个 alpha。我在循环中运行了以下代码。
请注意,我没有设置随机状态,因此它应该用作交叉验证。但是无论我运行代码多少次,我在这里得到的分数都在 0.11 左右(0.11-0.12)。
问题
为什么两种方法的分数 -0.0470788758558 和 0.11 如此不同?
python - scikit-learn GridSearchCV best_score_有什么意义
我可以在如何计算 scikit-learn GridSearchCV best_score_ 中看到答案?这个分数意味着什么。
我正在使用 scikit 学习决策树示例并尝试各种评分参数值。
每次我得到一个 diff 值 best_score_
,范围从0.92
到0.96
。
这个分数是否应该决定我最终应该使用的评分参数值。同样在 scikit learn 网站上,我看到在分类不平衡的情况下不应该使用准确度值。