我正在使用 lstm 模型。我了解小批量大小对于训练模型的意义。基本上它与批量更新梯度有关,而不是在每个样本之后更新。但是小批量大小在预测阶段意味着什么。我无法理解批量大小在预测阶段的作用。改变它会影响我的结果吗?
问问题
296 次
2 回答
0
批量大小等仅与学习有关。在您的模型学习(训练)后,它只会保存权重。在测试或预测时,它只会使用保存的权重进行预测。
默认情况下,普通 LSTM 在批量大小后重置单元状态,但您可以更改它。您可以使其在一个时期后更新状态,甚至保持所有状态。
于 2018-09-27T15:41:37.797 回答
0
批处理的概念比仅仅计算梯度更普遍。大多数神经网络框架允许您将一批图像输入到您的网络中,它们这样做是因为它更高效且易于与 GPU 并行化。
增加或减少预测的批大小通常只影响计算效率,而不影响结果。只有在有状态模型的情况下,例如具有状态的 LSTM(不是正常的 LSTM),您才会得到随批量大小而变化的结果。
于 2018-09-27T09:07:33.353 回答