我有一个带有 Dropout 层的模型(p=0.6)。我最终以.eval()
mode 训练模型并再次以 mode 训练模型.train()
,我发现训练.eval()
模式给了我更好的准确性和更快的训练数据损失减少,
train()
:火车损失:0.832,验证损失:0.821
eval()
:火车损失:0.323,验证损失:0.251
为什么会这样?
我有一个带有 Dropout 层的模型(p=0.6)。我最终以.eval()
mode 训练模型并再次以 mode 训练模型.train()
,我发现训练.eval()
模式给了我更好的准确性和更快的训练数据损失减少,
train()
:火车损失:0.832,验证损失:0.821
eval()
:火车损失:0.323,验证损失:0.251
为什么会这样?