5

我正在研究这里讨论的 LSTM 语言模型教程。

对于语言模型,通常使用模型在训练后从头开始生成一个新句子(即来自模型的样本)。

我是 TensorFlow 的新手,但我正在尝试使用我训练有素的模型来生成新单词,直到句末标记。

我最初的尝试:

x = tf.zeros_like(m.input_data)
state = m.initial_state.eval()
for step in xrange(m.num_steps):
    state = session.run(m.final_state,
                               {m.input_data: x,
                                m.initial_state: state})
    x = state

它失败并出现错误:

ValueError:使用序列设置数组元素。

4

1 回答 1

8

这里的问题似乎是传递的m.input_data: x映射。在这种情况下,TensorFlow 期望它是一个 numpy 数组(或一些可以隐式转换为 numpy 数组的对象),但该值是一个 TensorFlow ( 的结果)。feed_dictsession.run()xTensortf.zeros_like()

幸运的是,解决方案很简单。替换x = tf.zeros_like(m.input_data)为以下内容:

x = tf.zeros_like(m.input_data).eval()

...确保将x其转换为 numpy 数组。

(请注意,实现此目的的更直接方法是将初始值构造x为适当大小的 numpy 数组。)

于 2015-12-16T00:52:07.517 回答