背景: 我正在尝试在 tensorflow 中对多层 LSTM 进行建模。我正在使用一个通用函数来展开 LSTM:
tf.nn.dynamic_rnn
我在这里使用time_major = True
,所以我的数据必须是格式的[max_time, batch_size, depth]
。
据我了解max_time
是系列的时间步长。我的输入是 [224],我在开始时传入 FC 层以使其达到标签的大小
问题:
我正在使用数据管道获取 one_hot 向量(长度 = 70)的批次(32)中的标签。
70 长度向量对应于 1 个时间步长。
那么如何输入 [32, 32 ,70] 呢?目前我有 [32,70] (batch_size,num_classes)
。
如果有错误,请纠正我的理解。
我可以通过[1,32,70]
,以便 tensorflow 自己检测到每个批次的时间步长为 1 吗?