我目前正在使用求解器 adam 和激活 relu 解决 ScikitLearn 中两个类的分类问题。为了探索我的分类器是否存在高偏差或高方差,我使用 Scikitlearns 内置函数绘制了学习曲线:
https://scikit-learn.org/stable/auto_examples/model_selection/plot_learning_curve.html
我正在使用带有 8 个拆分的 Group-K_Fold 交叉验证。然而,我发现我的学习曲线很大程度上取决于我的分类器的批量大小:
它应该是这样的吗?我认为学习曲线正在解决依赖于训练数据部分的准确性分数,独立于任何批次/时期?我真的可以将此内置函数用于批处理方法吗?如果是,我应该选择哪个批次大小(全批次或批次大小=训练示例的数量或介于两者之间)以及我从中得到什么诊断?或者您通常如何诊断神经网络分类器的偏差/方差问题?
帮助将不胜感激!