问题标签 [gridsearchcv]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
923 浏览

python - GridSearchCV & RandomizedSearchCV - 你在运行后重新调整模型吗

我有一些测试和训练数据,测试数据没有任何因变量。

我目前正在运行 GridSearchCV 或 RandomizedSearchCV 来查找最佳参数。

我应该将所有“测试” X 和 y 值传递到 GridSearchCV 或 RandomizedSearchCV 中吗?

我知道它会进行交叉验证,所以我相信它可以吗?

但如果是这种情况,best_estimator 适合哪些数据?所有的?或者来自其中一个折叠的数据?

之后我需要重新拟合全套测试数据吗?

0 投票
1 回答
1207 浏览

machine-learning - 使用gridsearch优化scikit中的自定义高斯过程内核

我正在使用高斯过程,当我使用 scikit-learn GP 模块时,我很难使用gridsearchcv. 描述这个问题的最好方法是使用经典的 Mauna Loa 示例,其中适当的内核是使用已定义的内核(例如RBF和)的组合构建的RationalQuadratic。在那个例子中,自定义内核的参数没有被优化,而是被视为给定的。如果我想运行一个更一般的情况,我想使用交叉验证来估计这些超参数怎么办?我应该如何构建自定义内核,然后构建param_grid网格搜索的相应对象?

以一种非常天真的方式,我可以使用以下方式构建自定义内核:

但是,当然不能gridsearchcv使用 eg调用此函数GaussianProcessRegressor(kernel=custom_kernel(a,ls,l,alpha,nl))

在这个 SO question中提出了一个可能的前进路径但是我想知道是否有比从头开始编写内核(连同它的超参数)更简单的方法来解决这个问题,因为我希望使用标准内核的组合并且有还有我想把它们混在一起的可能性。

0 投票
1 回答
27 浏览

python - 如何在没有 tf-idf 的情况下创建组合?

我正在尝试不同的参数组合来确定实际上哪种参数组合能给我最好的结果。根据下面显示的代码,我已经尝试了 8 种不同的组合,但我想尝试其他没有 tf-idf 的组合。

所以我的问题是我应该怎么做parameters才能让python知道在8个组合之后,现在我们继续在没有tf-idf(tf__use_idf)的情况下继续进行,这样我们就可以有另一个额外的4个组合(仅基于binaryand stop_word)即,总共12个组合。

0 投票
1 回答
1061 浏览

python-3.x - 获取 PermissionError:[WinError 32] 进程无法访问该文件,因为它在 scikitlearn GridSearchCV 期间正被另一个进程使用

在. PermissionError: [WinError 32] The process cannot access the file because it is being used by another process_ GridSearchCV_scikit-learn

这是我的脚本:

错误堆栈跟踪:

软件堆栈:

0 投票
1 回答
119 浏览

python - 如何使用 GridSearch 配置 parameter_space?

请参见下面的示例:

问题是要了解我的 ANN 是如何留在内部的。

我希望这个例子使用 20 个神经元作为输入层,两个隐藏层 200 和 100 个神经元,一个输出层有 1 个神经元,因为我的问题是二元分类。

输入层 (20) --- 隐藏层 1 (200) --- 隐藏层 2 (100) --- 输出层 (1)

我知道在“hidden_​​layer_sizes”中只会插入隐藏层,但是我们如何指示输入和输出层呢?以及“GridSearchCV”如何交替隐藏层中的神经元数量以找到最佳配置?

0 投票
0 回答
159 浏览

keras - 无论如何使用带有 KerasRegressor 包装器的 fit_generator() 方法?

我正在尝试使用 GridSearchCV 为我的 LSTM 模型调整超参数,但使用了来自 keras.preprocessing.sequence 的 TimeseriesGenerator。如何修改 KerasRegressor 包装器以适应 fit_generator() 而不是 fit() 方法?

但是我如何将 KerasRegressor 与生成器一起使用

0 投票
1 回答
339 浏览

neural-network - 如何处理 MLPRegressor 中简单 (X,Y) 数据的过度拟合

结果 结果 2 已 解决

处理少量数据,并使用折叠处理过度拟合[GridSearchCV]

我完全不知道如何从我的模型中获得更好的估计。似乎当我尝试运行我的代码时,我得到了负面的准确性。我怎样才能提高 cross_val_score 或测试分数或任何你想称之为的东西,以便我可以更可靠地预测值。

我尝试添加更多数据(从 50 到 200+)。

我尝试了随机参数(并意识到这是一种天真的方法)

我还尝试使用 StandardScaler 在功能上清理我的数据

有人有什么建议吗?

第 63 行及以下的输出

0.9142644531564619 {'activation': 'logistic', 'alpha': 0.001, 'early_stopping': True, 'hidden_​​layer_sizes': 7, 'learning_rate': 'constant', 'learning_rate_init': 0.1, 'max_iter': 4000, 'random_state ':2,'求解器':'lbfgs','tol':0.01,'详细':真}

精度:-21.91 (+/- 58.89) [ -32.87854574 -105.0632913
-22.89836453 -7.33154414 -22.38773819 -3.3786339 -1.7658796 -3.78002866 -4.78727388 -14.8]

0 投票
1 回答
967 浏览

scikit-learn - 与 RFECV 结合时如何在 Gridsearch 中使用“max_features”?

感谢您提前回答。这是我的第一篇文章,我对 python 比较陌生,所以如果我格式化了一些可怕的东西,我深表歉意。

我试图在 sklearn 中结合递归特征消除和网格搜索来确定超参数和特征数量的最佳组合。使用下面的代码时,我得到max_features must be in (0, n_features] Estimator fit failed. for any other than max_features is 1. 我的数据集中有 300 多个特征,其中许多可能不重要。

'''

'''

0 投票
0 回答
3000 浏览

python - Python:GridSearchCV 执行时间过长

我在小型数据集上运行 GridSearchCV,其大小为 (13380,37),代码如下:

它运行了一天多。但是如果我在 iris 数据集上运行相同的参数,它会在 1 分钟内给出结果。数据是标准化的并且也使用多处理。我在这里有什么遗漏吗。

0 投票
1 回答
2168 浏览

scikit-learn - AttributeError:由于新版本的 sklearn,'str' 对象没有属性 'parameters'

我正在使用 sklearn 进行主题建模。在尝试从网格搜索输出中获取对数似然时,我收到以下错误:

AttributeError:“str”对象没有属性“参数”

我想我理解的问题是:旧版本中使用了“参数”,而我使用的是 sklearn 的新版本(0.22),这会出错。我还搜索了新版本中使用但找不到的术语。下面是代码:

提前致谢!