2

似乎 tensorflow 不支持双向 RNN 的可变批量大小。在此示例中,sequence_length与 绑定batch_size,这是一个 Python 整数:

  _seq_len = tf.fill([batch_size], tf.constant(n_steps, dtype=tf.int64))
  outputs, state1,state2 = rnn.bidirectional_rnn(rnn_fw_cell, rnn_bw_cell, input,
                                    dtype="float",
                                    sequence_length=_seq_len)

如何使用不同的批量大小进行训练和测试?

4

1 回答 1

5

双向代码适用于可变批量大小。例如,看一下这个测试代码,它创建了一个tf.placeholder(..., shape=(None, input_size))(其中None意味着批量大小可以是可变的)。

您可以通过少量修改将您的代码片段转换为使用可变批量大小:

# Compute the batch size based on the shape of the (presumably fed-in) `input`
# tensor. (Assumes that `input = tf.placeholder(..., shape=[None, input_size])`.)
batch_size = tf.shape(input)[0]

_seq_len = tf.fill(tf.expand_dims(batch_size, 0),
                   tf.constant(n_steps, dtype=tf.int64))
outputs, state1, state2 = rnn.bidirectional_rnn(rnn_fw_cell, rnn_bw_cell, input,
                                                dtype=tf.float32,
                                                sequence_length=_seq_len)
于 2016-03-23T21:42:21.713 回答