问题标签 [k-fold]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 实现模型(自动编码器 + CNN)如何确保我的模型不会过拟合?
我正在使用 Kfold 方法。我有一个大小为 1035 的数据集。我想确保我的模型不会过度拟合,因为我得到了 100% 的测试准确度,如果我增加 epoch,它会达到 100% 的测试准确度,然后又回到 77%。我还实施了提前停止,但我设置的耐心水平无法达到那里,因为它正在学习的每次迭代和耐心数量都会被重置。有人可以建议我该怎么做吗?我的模型有问题吗?我尝试改变学习率,但它影响了我的 ROC 曲线,但我得到了 100% 的测试准确率。
python - 如何在 sklearn 中使用 K 折交叉验证进行负二项式回归?
我将在数据集上应用负二项式回归模型,并使用交叉验证(K-Fold)检查模型分数以及特征的权重和显着性。这是应用 MinMax 缩放器后的数据框。w4 是一个分类变量。
我使用以下代码来获取训练模型在测试数据集上的分数,但在处理模型的训练和测试数据集时似乎存在问题。如果有人可以提供帮助,我将不胜感激。
python - 回归模型的 K 折交叉验证指标
我想对回归(非分类)模型进行交叉验证,并最终获得大约 0.90 的平均准确度。但是,我不知道该方法中使用什么指标来确定准确性。我知道 k 折交叉验证中的拆分是如何工作的。我只是不知道 scikit learn 库用来计算预测准确性的公式。(我知道它是如何用于分类模型的)。有人可以给我 sklearn.model_selection.cross_val_score 使用的指标/公式吗?
提前致谢。
keras - 分层 KFold 交叉验证 (Keras) ValueError:找到暗淡为 4 的数组。预计估计器 <= 2
我需要使用分层 kfold(不平衡的多类任务)交叉验证 keras 模型。是否可以在 (folds = list(StratifiedKFold(k, shuffle=True, random_state=1).split(x_train, y_train)) 中将 x_train/y_train 与 imagedatagenerator (flow_from_directory) 一起使用?在 Kaggle ( https:// /www.kaggle.com/stefanie04736/simple-keras-model-with-k-fold-cross-validation?select=train.json.7z),但是 x_train, y_train = next(train_generator) 没有映射数据和标签正确。任何帮助将不胜感激!
python - 应用分层 k 折交叉验证后如何将数据拆分为测试和训练?
我已经使用以下代码将列分配到其特定的 k 折叠:
现在数据框符合预期:
但是如何将其拆分为训练和测试拆分?
python - Weights&Biases Sweep Keras K-Fold 验证
我在 Keras 中使用 Weights&Biases 基于云的扫描。因此,首先我在 W&B 项目中创建一个新的 Sweep,其配置如下:
我的sweep.py
文件看起来像这样:
从.wandb agent
文件夹中的命令开始sweep.py
。
我对这个设置的体验是,第一个 wandb.init() 调用会初始化一个新的运行。好的,我可以删除它。但是当第二次调用 wandb.init() 时,它似乎忘记了它正在运行的扫描。在线扫描中列出了一个空运行(因为第一次 wandb.init() 调用),所有其他运行列在项目中,但不在扫描中。
我的目标是对 k 折交叉验证的每一折进行一次运行。至少我认为这将是这样做的正确方法。是否有不同的方法将扫描与 keras k-fold 交叉验证相结合?
python - GroupSplitShuffle 和 GroupKFolds 之间的区别
正如标题所说,我想知道 sklearnGroupKFold
和GroupShuffleSplit
.
两者都为具有组 ID 的数据进行训练测试拆分,因此这些组不会在拆分中分离。我检查了每个函数的一个训练集/测试集,它们看起来都做了一个很好的分层,但如果有人能确认所有拆分都这样做,那就太好了。
我对两者进行了测试,分为 10 次:
java - K-Fold 算法中的数组越界
我在运行我的项目时遇到问题,错误是数组超出范围,你能帮我吗?这是我的方法
当我尝试禁用循环程序成功成功的测试记录时,但是当我启用该循环时,我有一个错误 Array out of bounds in here
你能帮我解决这个问题吗?
scikit-learn - 使用 GroupKFold 交叉验证的调整模型在预测时需要组参数
我使用 GroupKFold 调整了 RandomForest(以防止数据泄漏,因为某些行来自同一组)。
我得到了一个最佳拟合模型,但是当我对测试数据进行预测时,它说它需要组特征。
那有意义吗?奇怪的是,组功能也成为最重要的功能之一。
我只是想知道是否有什么我可能做错了。
谢谢