问题标签 [k-fold]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
106 浏览

python - Python - 回归问题的 cross_val_score 不起作用 - “ValueError:不支持连续”

我正在尝试在 XGBoost 回归问题上使用 kFold。数据样本如下:

在此处输入图像描述

当我使用以下代码时:

我得到输出

当我尝试

我明白了

有人知道为什么吗?

谢谢

0 投票
0 回答
127 浏览

python - 实现模型(自动编码器 + CNN)如何确保我的模型不会过拟合?

我正在使用 Kfold 方法。我有一个大小为 1035 的数据集。我想确保我的模型不会过度拟合,因为我得到了 100% 的测试准确度,如果我增加 epoch,它会达到 100% 的测试准确度,然后又回到 77%。我还实施了提前停止,但我设置的耐心水平无法达到那里,因为它正在学习的每次迭代和耐心数量都会被重置。有人可以建议我该怎么做吗?我的模型有问题吗?我尝试改变学习率,但它影响了我的 ROC 曲线,但我得到了 100% 的测试准确率。

0 投票
1 回答
454 浏览

python - 如何在 sklearn 中使用 K 折交叉验证进行负二项式回归?

我将在数据集上应用负二项式回归模型,并使用交叉验证(K-Fold)检查模型分数以及特征的权重和显着性。这是应用 MinMax 缩放器后的数据框。w4 是一个分类变量。

我使用以下代码来获取训练模型在测试数据集上的分数,但在处理模型的训练和测试数据集时似乎存在问题。如果有人可以提供帮助,我将不胜感激。

0 投票
2 回答
335 浏览

python - 回归模型的 K 折交叉验证指标

我想对回归(非分类)模型进行交叉验证,并最终获得大约 0.90 的平均准确度。但是,我不知道该方法中使用什么指标来确定准确性。我知道 k 折交叉验证中的拆分是如何工作的。我只是不知道 scikit learn 库用来计算预测准确性的公式。(我知道它是如何用于分类模型的)。有人可以给我 sklearn.model_selection.cross_val_score 使用的指标/公式吗?

提前致谢。

0 投票
0 回答
212 浏览

keras - 分层 KFold 交叉验证 (Keras) ValueError:找到暗淡为 4 的数组。预计估计器 <= 2

我需要使用分层 kfold(不平衡的多类任务)交叉验证 keras 模型。是否可以在 (folds = list(StratifiedKFold(k, shuffle=True, random_state=1).split(x_train, y_train)) 中将 x_train/y_train 与 imagedatagenerator (flow_from_directory) 一起使用?在 Kaggle ( https:// /www.kaggle.com/stefanie04736/simple-keras-model-with-k-fold-cross-validation?select=train.json.7z),但是 x_train, y_train = next(train_generator) 没有映射数据和标签正确。任何帮助将不胜感激!

0 投票
1 回答
1136 浏览

python - 应用分层 k 折交叉验证后如何将数据拆分为测试和训练?

我已经使用以下代码将列分配到其特定的 k 折叠:

现在数据框符合预期:

但是如何将其拆分为训练和测试拆分?

0 投票
1 回答
746 浏览

python - Weights&Biases Sweep Keras K-Fold 验证

我在 Keras 中使用 Weights&Biases 基于云的扫描。因此,首先我在 W&B 项目中创建一个新的 Sweep,其配置如下:

我的sweep.py文件看起来像这样:

从.wandb agent文件夹中的命令开始sweep.py

我对这个设置的体验是,第一个 wandb.init() 调用会初始化一个新的运行。好的,我可以删除它。但是当第二次调用 wandb.init() 时,它似乎忘记了它正在运行的扫描。在线扫描中列出了一个空运行(因为第一次 wandb.init() 调用),所有其他运行列在项目中,但不在扫描中。

我的目标是对 k 折交叉验证的每一折进行一次运行。至少我认为这将是这样做的正确方法。是否有不同的方法将扫描与 keras k-fold 交叉验证相结合?

0 投票
2 回答
848 浏览

python - GroupSplitShuffle 和 GroupKFolds 之间的区别

正如标题所说,我想知道 sklearnGroupKFoldGroupShuffleSplit.

两者都为具有组 ID 的数据进行训练测试拆分,因此这些组不会在拆分中分离。我检查了每个函数的一个训练集/测试集,它们看起来都做了一个很好的分层,但如果有人能确认所有拆分都这样做,那就太好了。

我对两者进行了测试,分为 10 次:

0 投票
1 回答
28 浏览

java - K-Fold 算法中的数组越界

我在运行我的项目时遇到问题,错误是数组超出范围,你能帮我吗?这是我的方法

当我尝试禁用循环程序成功成功的测试记录时,但是当我启用该循环时,我有一个错误 Array out of bounds in here

你能帮我解决这个问题吗?

0 投票
2 回答
165 浏览

scikit-learn - 使用 GroupKFold 交叉验证的调整模型在预测时需要组参数

我使用 GroupKFold 调整了 RandomForest(以防止数据泄漏,因为某些行来自同一组)。

我得到了一个最佳拟合模型,但是当我对测试数据进行预测时,它说它需要组特征。

那有意义吗?奇怪的是,组功能也成为最重要的功能之一。

我只是想知道是否有什么我可能做错了。

谢谢