问题标签 [gridsearchcv]

python - Gridsearch n_jobs=-1 和 RandomForestRegressor n_jobs=-1 没有正确使用 loky worker


用命令nohup python -u model.py &

然后使用top -c我监视过程。

一旦我使用我的数据子集启动流程,我可以看到所有工作人员都在运行,但是如果我尝试使用我所有的 600 万个观察结果,流程输出[Parallel(n_jobs=-1)]: Using backend LokyBackend with 128 concurrent workers.

从多个工人开始,然后过一段时间只使用 1 个核心。如果我只使用 ~200k 观察,则该过程使用所有核心。为什么大数据集不能使用所有核心?

scikit-learn - 如何使用 GridSearchCV 进行一类分类

我尝试使用 GridSearchCV 为我的分类器提供最佳参数。我正在使用一类 SVM,我的代码是:



python - 如何使用 AdaBoost 和 GridSearchCV 获得最佳估计器参数

我正在使用AdaBoost,我想看看哪些估算器参数最适合使用GridSearchCV. 是否可以在我的“参数”变量中包含估计器参数?例如,如何改变 DecisionTreeClassifier 的 max_depth?

python - 如何从 GridSearchCV 绘制 cv_results_replacy grid_scores_?

我正在寻找一种在 sklearn中绘制图表cv_results_的方法。GridSearchCV但是示例中的代码使用了grid_scores_


cv_results包括 ['params']



python - 如何使用 keras 顺序模型使用 gridsearchCV 调整 l2 正则化器

我正在尝试使用 gridsearchCV 调整超参数 kernel_regularizer,但 gridsearchCV 一直告诉我我为 kernel_regularizer 输入的参数名称不是真实参数

我尝试了各种参数名称,例如 l2、kernel_regularizer、kernel、regularizers.l2、regularizers.l2(),但都没有奏效。


我的顺序模型使用 kernel_regularizer=l2(0.01)

python - RandomSearchCV 如何处理模型/内存?

我想知道sklearn.model_selection.RandomizedSearchCVGridSearchCV在某种程度上)是如何处理模型、信息和内存的。实际上,尽管进行了一些研究,但我找不到任何资源来解释(使用n_jobs =-1>1)每个堆叠步骤存储的内容。



python - 从 sklearn.model_selection.GridSearchCV 获取 keyerror


当我试图访问 gsearch_cv 的所有键时,我无法找到字典键 mean_train_score。

python - Jupiter Notebook 中的 GridSearchCV 进度

是否可以在 Jupyter Notebook 中查看 GridSearchCV 的进度?我在 python 中运行这个脚本:


python-3.x - Plotting Grid Search CV grid parameter results on one graph

In sklearn 0.17.1 there was-->> grid_scores_ : list of named tuples (https://scikit-learn.org/0.17/modules/generated/sklearn.grid_search.GridSearchCV.html#sklearn.grid_search.GridSearchCV)

Now in sklearn 0.21.2 it is replaced with-->> cv_results_ : dict of numpy (masked) ndarrays (https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html)

Previously with sklearn 0.17.1, I was able to plot all grid parameters on a single plot using grid_scores_ but now I am unable to aggregate the values obtained from cv_results_ as there is no "mean_validation_score" in newer version.

I have an existing code which plotted all the parameters score in sklearn 0.17.1 (https://scikit-learn.org/0.17/modules/generated/sklearn.grid_search.GridSearchCV.html#sklearn.grid_search.GridSearchCV) where grid_scores_ was used and it perfectly plotted all the values on one plot.

In newer version of slearn cv_results_ has been replaced with grid_scores_. I have tried to append all the values in want to plot all the parameters on one plot, currently I am unable to add the correct values to plot on the graph.

This image is not filled as there is no "mean_validation_score" which can be filled for each subplot now: https://ibb.co/Z6jwnMr

Expected Result (should be filled): https://ibb.co/Z6jwnMr

However each subplot on the plot should have a curve depicting best value for the parameter. The keys do not have a "mean_validation_score" to plot the actual test score which was there in sklearn 0.17.1 but not in sklearn 0.20.2

Kindly let me know if there is still a way to plot all test scores on subplots of a single plot. Thanks in advance!!

machine-learning - GridSearchCV 未在 colab 中获取 mean_test_score

我在 colab 中randomForestClassifier使用。GridSearchCV但是,myGridSearchCV不返回 mean_test_score 并显示它不存在。当我尝试检查clf.cv结果时,没有 mean_test_score。这适用于 Jupyter 笔记本而不是 Colab,我最近遇到了这个问题。