-3

我正在用游戏数据训练一个具有 10 个隐藏层的深度残差网络。

有谁知道为什么我在这里没有过度拟合?经过 100 次训练后,训练和测试损失仍在减少。

https://imgur.com/Tf3DIZL

4

1 回答 1

0

只是一些建议:

  1. 对于深度学习,建议进行 90/10 或 95/5 拆分 (Andrew Ng)
  2. 曲线之间的这种微小差异意味着您learning_rate没有调整;尝试增加它(epochs如果你将实施某种“智能”lr-reduce,可能还有数量)
  3. DNN 尝试用少量数据(10-100 行)和大量迭代进行过度拟合也是合理的
  4. 检查集合中的数据泄漏:每一层内的权重分析可以帮助你
于 2019-02-02T08:15:50.903 回答