我想在 TensorFlow 中构建一个循环神经网络 (RNN),以预测单词序列中的下一个单词。我看过几个教程,例如TensorFlow之一。我知道训练文本中的每个单词都映射到一个整数索引。但是,我仍然没有得到关于输入的一些内容:
网络是批量训练的,例如同时使用 128 个示例。假设我们的词汇表中有 10.000 个单词。网络的输入是大小为(128,sequence_length)的矩阵还是单热编码张量(128,sequence_length,10.000)?
第二维,即序列长度有多大?我是否在批次的每一行中使用一个句子,用零填充比其他句子短的句子?
或者一行可以对应多个句子?例如,一行可以代表“这是一个测试句。怎么样”?如果是这样,第二句话在哪里继续?在同一批次的下一行?还是在下一批的同一行?如何保证 TensorFlow 正确地继续句子?
即使这些问题很简单,我也无法找到答案。我希望有人能帮帮忙!