我试图使用 RNN(特别是 LSTM)进行序列预测。但是,我遇到了可变序列长度的问题。例如,
sent_1 = "I am flying to Dubain"
sent_2 = "I was traveling from US to Dubai"
我正在尝试使用基于此基准的简单 RNN 来预测当前单词之后的下一个单词,以构建 PTB LSTM 模型。
但是,num_steps
参数(用于展开到先前的隐藏状态)在每个 Tensorflow 的 epoch 中应该保持不变。基本上,批处理句子是不可能的,因为句子的长度不同。
# inputs = [tf.squeeze(input_, [1])
# for input_ in tf.split(1, num_steps, inputs)]
# outputs, states = rnn.rnn(cell, inputs, initial_state=self._initial_state)
在这里,num_steps
在我的情况下,每个句子都需要更改。我已经尝试了几个黑客,但似乎没有任何工作。