我想构建一个带有特殊词嵌入的 LSTM,但我对它的工作原理有一些疑问。
您可能知道,一些 LSTM 对字符进行操作,因此它是字符输入,字符输出。我也想做同样的事情,对单词进行抽象,以通过嵌套的 LSTM 学习强大的嵌入,以抵抗轻微的字符级错误。
因此,一个微小的 LSTM 将展开一个单词的每个字母,然后这将创建一个单词的嵌入。然后将句子中的每个嵌入单词作为输入馈送到更高级别的 LSTM,该 LSTM 将在每个时间步在单词级别上操作,而不是在字符上操作。
问题: - 我再也找不到讨论这个问题的研究论文了。如果你知道我在说什么,我想给我想做的事情起个名字。- 是否已经存在一些 TensorFlow 开源代码?- 否则,您对如何实现它有想法吗?神经网络的输出可能更难处理,因为我们需要撤消词嵌入以使用输出嵌套 LSTM 对字符进行训练。整个事情应该作为一个单元训练一次(工作流程:LSTM chars in,LSTM on words,LSTM chars out)。
我想这rnn_cell.MultiRNNCell
会将 LSTM 堆叠在一起而不是嵌套它们。
否则您会建议将嵌入(输入和输出)训练为主 LSTM 之外的自动编码器吗?