1

我看到了在不同应用程序中设置的范围广泛的scale值。tf.contrib.layers.l2_regularizer是否有确定 值的一般规则scale?例如,

(1) 我们是否需要考虑权重中的元素数量并使用 对其进行归一化scale

(2) 如果均方误差 (MSE) 是损失的一部分,那么 MSE 和 l2 损失之间的适当比率是多少?

4

0 回答 0