我需要在 Tensorflow 中运行一个编码器-解码器模型。我看到使用可用的 APIbasic_rnn_seq2seq(encoder_input_data, decoder_input_data, lstm_cell)
等,可以创建编码器-解码器系统。
- 我们如何在这样的模型中输入诸如 word2vec 之类的嵌入?我知道我们可以进行嵌入查找,但根据 API
encoder_input_data
是一个大小为 batch_size x input_size 的 2D 张量列表。如何在此设置中使用其各自的词嵌入来表示每个词?甚至在embedding_rnn_seq2seq
内部提取嵌入。如何将预先计算的词嵌入作为输入? - 我们如何通过 API 获取成本/困惑度?
- 在测试实例的情况下,我们可能不知道相应的解码器输入。如何处理这种情况?