我正在使用多层神经网络。我打算做小批量梯度下降。假设我有 100 个超过 100 万个数据点的小批量。我不明白我必须更新整个网络的权重的部分。当我对这 100 个样本进行前向传递时,我将这 100 个样本的所有错误相加。除了这个我还能做什么?我是否也必须并排计算隐藏层错误?什么时候计算?
问问题
1918 次
我正在使用多层神经网络。我打算做小批量梯度下降。假设我有 100 个超过 100 万个数据点的小批量。我不明白我必须更新整个网络的权重的部分。当我对这 100 个样本进行前向传递时,我将这 100 个样本的所有错误相加。除了这个我还能做什么?我是否也必须并排计算隐藏层错误?什么时候计算?