问题标签 [overfitting-underfitting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - 如何使用 vgg16 防止在强化学习中过度拟合
我正在尝试训练一个模型来识别面部表情,所以基本上是一个有 7 个类的分类问题:
我正在使用 ImageDataGenerator 并且我用 VGG16 做了我的模型,没有像这样的头部迁移学习:
我使用了优化器和提前停止并运行了 100 个 epoch:
在 61 个 epoch 之后,我提前停止了,我得到了不错的准确度,但 val_accuracy 与之相比非常低:
关于如何解决这种过度拟合的任何建议?谢谢!
python - 使用 pykalman 2d 过拟合的卡尔曼滤波器
我正在使用卡尔曼平滑器根据 GPS 点估计一个人的路径。前段时间我已经有一个问题,这里回答得很好:kalman filter 2d with pykalman。但是现在我遇到了问题,卡尔曼滤波器严重过度拟合这些点。平均到测量点的平均距离变化为 0.00016 m。所以我的问题是,如何防止卡尔曼滤波器过度拟合?
我的代码:
我在这里还是很新,所以欢迎任何反馈,我可以如何改进我的问题。
machine-learning - 如果验证没有收敛,我的模型是否过度拟合?
我有这张图,我的验证损失没有收敛。我是对的,这是过度拟合的情况吗? 图形 图片
python - 使用正则化技术后如何解释预训练的 CNN 模型?
我想在我的数据集 (RVL-CDIP) 上微调预训练的 VGG16 和 Inception-ResNetV2(通过 ImageNet 数据集)。仅供参考 - 我有过拟合(根据训练和验证集的 acc/loss 图计算出来)所以尝试了几乎所有策略的组合,包括数据增强、退出、l2 正则化和解冻某些层。此外,我绘制了所有情况下训练集和验证集的准确性和损失,但找不到任何规则来找出哪一个更适合真实数据。(我也有测试数据的结果,但没有帮助,有时即使我有严重 的过度拟合也很好!)问题是,我不知道如何解释结果以选择最佳的正则化策略!有什么帮助吗?
machine-learning - 我应该总是在特征选择过程之前进行训练/测试拆分吗?
我已经看到应该在训练测试拆分之前还是之后进行特征选择?线程并阅读它。一个人在那里解释得很好。然而,这是必须的吗?我的意思是,如果我将整个数据集用于任何问题或数据,而不将其拆分用于特征选择过程。我总是过拟合吗?
例如,我已经为我的整个数据集尝试了 Boruta。它给了我 23 个功能。但是,我也仅使用我的训练集和测试集尝试了 Boruta。它按顺序产生了 15 个和 11 个特征。
如果我过度拟合,我怎么能理解呢?
python - 与使用 keras 在 python 上训练相同的网络相比,在 Matlab 上训练 CNN 给出不同的结果
我正在使用 Keras 训练一个网络来解决 python 上的分类问题,我使用的模型如下:
当我在我的训练数据上训练这个网络时,与训练损失相比,我得到了更高的验证损失,如下所示:
我很清楚我面临的问题是由于过度拟合造成的,但是当我在 Matlab 上使用相同的训练数据训练相同的网络时,训练损失和验证损失的值彼此接近。Matlab上Training Progress的图片链接为: Training Progress
如果有人能向我解释为什么我不能在 python 上得到相同的结果,我将不胜感激?你会建议什么来解决这个问题?