我tf.estimator.Estimator
用于开发我的模型,
我写了一个model_fn
并训练了 50,000 次迭代,现在我想对我model_fn
的 .
我不想从头开始训练,我想从 50,000 检查点恢复所有旧变量,并从这一点继续训练。当我尝试这样做时,我得到一个NotFoundError
如何做到这一点tf.estimator.Estimator
?
我tf.estimator.Estimator
用于开发我的模型,
我写了一个model_fn
并训练了 50,000 次迭代,现在我想对我model_fn
的 .
我不想从头开始训练,我想从 50,000 检查点恢复所有旧变量,并从这一点继续训练。当我尝试这样做时,我得到一个NotFoundError
如何做到这一点tf.estimator.Estimator
?
TL;DR从前一个检查点加载变量的最简单方法是使用函数tf.train.init_from_checkpoint()
。只需在model_fn
Estimator 中调用此函数即可覆盖相应变量的初始化程序。
更详细地说,假设您已经在 MNIST 上训练了第一个具有两个隐藏层的模型,名为model_fn_1
. 权重保存在目录中mnist_1
。
def model_fn_1(features, labels, mode):
images = features['image']
h1 = tf.layers.dense(images, 100, activation=tf.nn.relu, name="h1")
h2 = tf.layers.dense(h1, 100, activation=tf.nn.relu, name="h2")
logits = tf.layers.dense(h2, 10, name="logits")
loss = tf.losses.sparse_softmax_cross_entropy(labels=labels, logits=logits)
optimizer = tf.train.GradientDescentOptimizer(0.01)
train_op = optimizer.minimize(loss, global_step=tf.train.get_global_step())
return tf.estimator.EstimatorSpec(mode, loss=loss, train_op=train_op)
# Estimator 1: two hidden layers
estimator_1 = tf.estimator.Estimator(model_fn_1, model_dir='mnist_1')
estimator_1.train(input_fn=train_input_fn, steps=1000)
现在我们要训练一个model_fn_2
具有三个隐藏层的新模型。我们想要加载前两个隐藏层的权重h1
和h2
。我们tf.train.init_from_checkpoint()
用来这样做:
def model_fn_2(features, labels, mode, params):
images = features['image']
h1 = tf.layers.dense(images, 100, activation=tf.nn.relu, name="h1")
h2 = tf.layers.dense(h1, 100, activation=tf.nn.relu, name="h2")
h3 = tf.layers.dense(h2, 100, activation=tf.nn.relu, name="h3")
assignment_map = {
'h1/': 'h1/',
'h2/': 'h2/'
}
tf.train.init_from_checkpoint('mnist_1', assignment_map)
logits = tf.layers.dense(h3, 10, name="logits")
loss = tf.losses.sparse_softmax_cross_entropy(labels=labels, logits=logits)
optimizer = tf.train.GradientDescentOptimizer(0.01)
train_op = optimizer.minimize(loss, global_step=tf.train.get_global_step())
return tf.estimator.EstimatorSpec(mode, loss=loss, train_op=train_op)
# Estimator 2: three hidden layers
estimator_2 = tf.estimator.Estimator(model_fn_2, model_dir='mnist_2')
estimator_2.train(input_fn=train_input_fn, steps=1000)
会将检查点中作用域中的assignment_map
每个变量加载h1/
到新作用域中h1/
,与h2/
. 不要忘记/
最后让 TensorFlow 知道它是一个变量范围。
我找不到使用预制估算器来完成这项工作的方法,因为您无法更改它们的model_fn
.