我看到了在不同应用程序中设置的范围广泛的scale
值。tf.contrib.layers.l2_regularizer
是否有确定 值的一般规则scale
?例如,
(1) 我们是否需要考虑权重中的元素数量并使用 对其进行归一化scale
?
(2) 如果均方误差 (MSE) 是损失的一部分,那么 MSE 和 l2 损失之间的适当比率是多少?
我看到了在不同应用程序中设置的范围广泛的scale
值。tf.contrib.layers.l2_regularizer
是否有确定 值的一般规则scale
?例如,
(1) 我们是否需要考虑权重中的元素数量并使用 对其进行归一化scale
?
(2) 如果均方误差 (MSE) 是损失的一部分,那么 MSE 和 l2 损失之间的适当比率是多少?