我正在尝试建立一个预测模型,最初我做了变分自动编码器并将特征从 2100 减少到 64。
现在有 (5000 X 64) 样本用于训练和 (2000 X 64) 用于测试,我尝试构建一个完全前馈或 MLP 网络,但结果当我的平均绝对误差达到 161 时,它并没有下降。我尝试改变所有超参数以及隐藏层,但没有用。
谁能建议原因是什么以及我如何克服这个问题?
我正在尝试建立一个预测模型,最初我做了变分自动编码器并将特征从 2100 减少到 64。
现在有 (5000 X 64) 样本用于训练和 (2000 X 64) 用于测试,我尝试构建一个完全前馈或 MLP 网络,但结果当我的平均绝对误差达到 161 时,它并没有下降。我尝试改变所有超参数以及隐藏层,但没有用。
谁能建议原因是什么以及我如何克服这个问题?
首先,训练神经网络可能有点棘手。训练后网络的性能(甚至是训练过程本身)取决于很多因素。其次,您必须更具体地了解您的问题中的数据集(而不是问题)。只看你的问题,可以说是......