问题标签 [gridsearchcv]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用 GridSearchCV 控制预测 > 0
我正在使用GridSearchCV
以估计我的回归器的参数。我使用评分函数mean_squared_log_error(我想继续使用它)
y 始终为正,但发生的情况是 5 折网格搜索中的某些预测恰好为负(即使它不应该发生,因为我的目标变量始终为正),因此我收到错误消息
因为记分员试图计算负数的对数(不幸的预测)。
有没有办法控制 GridSearchCV 中的预测?你会如何解决这个问题?
python - GridSearchCV 拟合
我在使用二值化标签来拟合分类器时遇到问题。
y_train 通过以下方法二值化:
我收到以下错误:
文件“C:\Python\lib\site-packages\sklearn\utils\validation.py”,第 788 行,在 column_or_1d 中引发 ValueError("bad input shape {0}".format(shape)) ValueError: bad input shape ( 545, 3)
输入标签形状是 (682, 3) 而不是 (545, 3)。
我的教授告诉我在 gridSearchCV 中使用二值化标签,但是阅读 scikit-learn 文档我认为我不能这样做。
python - 如何使用 sklearn 中的 GridSearchCV 设置自己的评分以进行回归?
我曾经使用 GridSearchCV(...scoring="accuracy"...) 进行分类模型。现在我将使用 GridSearchCV 作为回归模型并使用自己的错误函数设置评分。
示例代码:
但是,我发现它在错误分数最高时返回参数集。结果,我得到了最差的参数集和分数。在这种情况下,我怎样才能得到最好的估计和分数?
概括:
分类 -> GridSearchCV(scoring="accuracy") -> best_estimaror...best
回归 -> GridSearchCV(scroing=rmse_score) -> best_estimator...worst
python - 像素分类神经网络gridsearch标签形状误差
我正在尝试解决超参数调整情况下的错误:
我正在尝试处理的图像具有(64, 64, 3)
(宽度、高度、通道)的形状。(64, 64, 1)
由于我正在执行二进制分类任务,因此相应的标签具有形状,但对于每个像素。
我使用的模型是 UNET 模型:
输出:
是:
-
来电:
将导致以下错误:
python - 通过 GridSearchCV 使用多指标评估
我正在尝试在 GridSearchCV 中使用多个指标。我的项目需要多个指标,包括“准确性”和“f1 分数”。但是,在遵循 sklearn 模型和在线帖子之后,我似乎无法让我的工作。这是我的代码:
我的错误发生在custom_knn.fit(X_train,y_train)
. 此外,如果您注释掉scoring=met_grid, refit='accuracy', return_train_score=True
,它可以工作。这是我的错误:
此外,如果您能解释多个指标评估或将我推荐给可以的人,那将不胜感激!
谢谢
python - GridSearchCV - 错误:具有多个元素的数组的真值不明确。使用 a.any() 或 a.all()
我正在尝试在 python 中使用神经网络分类。scikit-learn
我生成了我的数据,将其拆分为训练和测试,并在模型中使用它MLPClassifier()
。
我接下来打算做的是评估这个模型中使用的参数sklearn.model_selection.GridSearchCV
.
这是我的代码:
X_train
并且X_test
是具有 2 个特征的数组。
一切正常,但在线CV_unknwnMLPC.fit(X_train, y_train)
我收到以下错误:
我在网上检查了一些答案,并仔细检查了参数param_gridMLPC
以确保它们提供得很好,但错误仍然存在。
我究竟做错了什么?
提前致谢
python - 自定义评分函数 GridsearchCV
我想为 GridsearchCV 实现自定义评分功能。我试图查看此示例https://stats.stackexchange.com/questions/110599/how-to-get-both-mse-and-r2-from-a-sklearn-gridsearchcv,但我的代码以一种无限循环,它继续运行而没有给出任何结果......这是我正在使用的代码:
我在 Jupyter 笔记本中运行此代码。
提前致谢!
scikit-learn - 使用 RFECV 和 GridSearchCV 堆叠 StandardScaler()
所以我发现 StandardScaler() 可以让我的 RFECV 在我的 GridSearchCV 中,每个嵌套的 3 折交叉验证运行得更快。如果没有 StandardScaler(),我的代码运行了超过 2 天,所以我取消并决定将 StandardScaler 注入到进程中。但现在它已经运行了 4 个多小时,我不确定我是否做得对。这是我的代码:
老实说,我认为我的做法并不正确,因为我认为 StandardScaler() 应该放在 GridSearchCV() 函数中,以便每次折叠都标准化数据,而不仅仅是一次(?)。如果我错了或者我的管道不正确以及为什么它仍然运行了很长时间,请纠正我。
我有 8,000 行的 145 个特征要被 RFECV 修剪,以及 6 个 C 值要被 GridSearchCV 修剪。因此对于每个 C-Value,最佳特征集由 RFECV 确定。
谢谢!
更新:
所以我将 StandardScaler 放在 RFECV 中,如下所示:
但它仍然抛出以下错误:
ValueError: 估计器管道的参数 C 无效(memory=None, steps=[('standardscaler', StandardScaler(copy=True, with_mean=True, >with_std=True)), ('svc', SVC(C=1.0, cache_size =200,class_weight=None,>coef0=0.0,decision_function_shape='ovr',degree=3,gamma='auto',kernel='linear',max_iter=-1,probability=False,random_state=None,shrinking=True , tol=0.001, 详细=False))])。使用 > 检查可用参数列表
estimator.get_params().keys()
。
python - 在 scikit learn 中实现自定义损失函数
我想在 scikit learn 中实现自定义损失函数。我使用以下代码片段:
传入的参数应该是什么my_custom_loss_func
?我的标签矩阵称为labm
. 我想计算实际输出和预测输出(由模型)乘以真实输出之间的差异。如果我使用labm
代替y_true
,我应该使用什么代替y_pred
?
python-3.x - 使用 GridSearchCV 制作自定义记分器
我在下面的代码中尝试使用自定义记分器,我用 GridSearchCV 定义了“custom_loss_five”来调整超参数。我有下面的示例代码。我也有一些样本数据。我收到错误“numpy.dtype”对象没有属性“base_dtype”。我认为这是因为我将 keras 代码与 sklearn 混合在一起。我也在使用同样的“custom_loss_five”函数来训练神经网络。所以这就是我使用keras的原因。如果有人能指出问题并让我知道如何调整该功能以与 GridSearchCV 一起使用,我将不胜感激。
样本数据:
代码:
错误: