我已经训练了一个 seq2seq tensorflow 模型,用于将句子从英语翻译成西班牙语。我为 615 700 步训练了一个模型,并成功保存了模型检查点。我的英语和西班牙语句子的训练数据量是 200 000。我想重新训练这个模型,从 615 700 步中得到 10K 新数据句子。为此,我正在使用序列到序列 tensoflow 模型。如何从最后一个检查点开始重新训练模型?这是我用于翻译的链接。
我的火车文件夹中有 3 种类型的文件:
.index
.meta
.data
and checkpoint file.
我的新训练数据集文件分别是europarl_train.es-en.en
和europarl_train.es-en.es
用于英语和西班牙语句子。
我编写了一个代码来加载我的模型 .meta 文件和权重
import data_utils
import seq2seq_model
import translate
import tensorflow as tf
with tf.Session() as sess:
saver = tf.train.import_meta_graph('/home/i9/L-T_Model_Training/16_NOV_MODEL/train/translate.ckpt-615700.meta')
saver.restore(sess,tf.train.latest_checkpoint('/home/i9/L-T_Model_Training/16_NOV_MODEL/train/.'))
我怎样才能开始保留这个数据集?