我注意到 tensorflow 的 api 中已经有批量标准化函数。我不明白的一件事是如何改变培训和测试之间的程序?
批量标准化在测试期间的作用与在训练期间的作用不同。具体来说,在训练期间使用固定的均值和方差。
某处有一些很好的示例代码吗?我看到了一些,但是对于范围变量,它变得令人困惑
我注意到 tensorflow 的 api 中已经有批量标准化函数。我不明白的一件事是如何改变培训和测试之间的程序?
批量标准化在测试期间的作用与在训练期间的作用不同。具体来说,在训练期间使用固定的均值和方差。
某处有一些很好的示例代码吗?我看到了一些,但是对于范围变量,它变得令人困惑
你是对的,tf.nn.batch_normalization
它只提供了实现批量标准化的基本功能。您必须添加额外的逻辑来跟踪训练期间的移动均值和方差,并在推理过程中使用经过训练的均值和方差。您可以查看此示例以获得非常通用的实现,但这里有一个不使用的快速版本gamma
:
beta = tf.Variable(tf.zeros(shape), name='beta')
moving_mean = tf.Variable(tf.zeros(shape), name='moving_mean',
trainable=False)
moving_variance = tf.Variable(tf.ones(shape),
name='moving_variance',
trainable=False)
control_inputs = []
if is_training:
mean, variance = tf.nn.moments(image, [0, 1, 2])
update_moving_mean = moving_averages.assign_moving_average(
moving_mean, mean, self.decay)
update_moving_variance = moving_averages.assign_moving_average(
moving_variance, variance, self.decay)
control_inputs = [update_moving_mean, update_moving_variance]
else:
mean = moving_mean
variance = moving_variance
with tf.control_dependencies(control_inputs):
return tf.nn.batch_normalization(
image, mean=mean, variance=variance, offset=beta,
scale=None, variance_epsilon=0.001)