问题标签 [overfitting-underfitting]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
123 浏览

keras - 经过一些时代迁移学习后,验证损失增加

我的验证损失在前 50 个 epoch 以良好的速度下降,但在那之后的 10 个 epoch 验证损失停止下降。我正在使用 mobilenet 并冻结图层并添加我的自定义头部。我的自定义头如下:

我正在使用 alpha 0.25,学习率 0.001,衰减学习率 / 时期,nesterov 动量 0.8。我也在使用 earlystoping 回调,耐心等待 10 个 epoch。

失利准确性

0 投票
1 回答
37 浏览

tensorflow - 如何使用 vgg16 防止在强化学习中过度拟合

我正在尝试训练一个模型来识别面部表情,所以基本上是一个有 7 个类的分类问题:

我正在使用 ImageDataGenerator 并且我用 VGG16 做了我的模型,没有像这样的头部迁移学习:

我使用了优化器和提前停止并运行了 100 个 epoch:

在 61 个 epoch 之后,我提前停止了,我得到了不错的准确度,但 val_accuracy 与之相比非常低:

关于如何解决这种过度拟合的任何建议?谢谢!

0 投票
4 回答
315 浏览

python - PolynomialFeatures 和 LinearRegression 返回不需要的系数

我的graph.csv:

结果产生:

在此处输入图像描述

它显然产生了错误的预测;对于每个 x,y 应该增加。

我错过了什么?我尝试改变学位,但并没有变得更好。例如,当我使用 4 级时,y 增加得非常非常快。

0 投票
1 回答
120 浏览

python - Siamese Network-Train 自己的数据集并判断过拟合

我使用Siamese Network训练自己的数据集。我使用Tensorboard将训练结果可视化。我是初学者,不太擅长判断是否过拟合。请帮忙看看,谢谢!图 1 和图 2 是火车。图 3 和图 4 是验证。 图1 这是训练集的准确率

图 2 火车损失 图 3 Validation set 的准确率 图 4 验证损失

0 投票
0 回答
111 浏览

python - 使用 pykalman 2d 过拟合的卡尔曼滤波器

我正在使用卡尔曼平滑器根据 GPS 点估计一个人的路径。前段时间我已经有一个问题,这里回答得很好:kalman filter 2d with pykalman。但是现在我遇到了问题,卡尔曼滤波器严重过度拟合这些点。平均到测量点的平均距离变化为 0.00016 m。所以我的问题是,如何防止卡尔曼滤波器过度拟合?

我的代码:

我在这里还是很新,所以欢迎任何反馈,我可以如何改进我的问题。

0 投票
1 回答
28 浏览

machine-learning - 如果验证没有收敛,我的模型是否过度拟合?

我有这张图,我的验证损失没有收敛。我是对的,这是过度拟合的情况吗? 图形 图片

0 投票
0 回答
22 浏览

python - 使用正则化技术后如何解释预训练的 CNN 模型?

我想在我的数据集 (RVL-CDIP) 上微调预训练的 VGG16 和 Inception-ResNetV2(通过 ImageNet 数据集)。仅供参考 - 我有过拟合(根据训练和验证集的 acc/loss 图计算出来)所以尝试了几乎所有策略的组合,包括数据增强、退出、l2 正则化和解冻某些层。此外,我绘制了所有情况下训练集和验证集的准确性和损失,但找不到任何规则来找出哪一个更适合真实数据。(我也有测试数据的结果,但没有帮助,有时即使我有严重 的过度拟合也很好!)问题是,我不知道如何解释结果以选择最佳的正则化策略!有什么帮助吗?

0 投票
0 回答
259 浏览

machine-learning - 我应该总是在特征选择过程之前进行训练/测试拆分吗?

我已经看到应该在训练测试拆分之前还是之后进行特征选择?线程并阅读它。一个人在那里解释得很好。然而,这是必须的吗?我的意思是,如果我将整个数据集用于任何问题或数据,而不将其拆分用于特征选择过程。我总是过拟合吗?

例如,我已经为我的整个数据集尝试了 Boruta。它给了我 23 个功能。但是,我也仅使用我的训练集和测试集尝试了 Boruta。它按顺序产生了 15 个和 11 个特征。

如果我过度拟合,我怎么能理解呢?

0 投票
0 回答
74 浏览

python - 与使用 keras 在 python 上训练相同的网络相比,在 Matlab 上训练 CNN 给出不同的结果

我正在使用 Keras 训练一个网络来解决 python 上的分类问题,我使用的模型如下:

当我在我的训练数据上训练这个网络时,与训练损失相比,我得到了更高的验证损失,如下所示:

我很清楚我面临的问题是由于过度拟合造成的,但是当我在 Matlab 上使用相同的训练数据训练相同的网络时,训练损失和验证损失的值彼此接近。Matlab上Training Progress的图片链接为: Training Progress

如果有人能向我解释为什么我不能在 python 上得到相同的结果,我将不胜感激?你会建议什么来解决这个问题?

0 投票
1 回答
1117 浏览

object-detection - 如何理解 yolov4 训练是否过拟合?

我正在训练在自定义数据集中使用 YOLOv4 进行人体检测。我使用这个命令来训练数据集:

在训练结束时,它给出了这个图表:

在此处输入图像描述

验证最多提供 97% 的准确率。但是当我观察测试数据时,它在视频录制中给出了大约 80% 的准确率。是否过拟合?我怎么解决这个问题?我认为图表中的准确性应该越来越高。