9

我设法在 1.1 版本中使用tf.contrib.seq2seq类在tensorflow中构建了一个序列到序列模型。 要知道我使用TrainingHelper来训练我的模型。但是这个助手是在解码器中提供先前解码的值以进行训练还是只提供基本事实?如果不是,我如何将先前解码的值作为解码器的输入而不是地面真值提供?

4

1 回答 1

11

TrainingHelper在每一步都提供基本事实。如果要使用解码器输出,可以使用预定采样[1]。计划采样在ScheduledEmbeddingTrainingHelper和中实现ScheduledOutputTrainingHelper,因此您可以使用两者之一(取决于您的特定应用程序)而不是TrainingHelper. 另请参阅此处的此线程: Tensorflow 中的预定采样

[1] https://arxiv.org/pdf/1506.03099.pdf

于 2017-06-02T14:33:18.110 回答