我已经设法用 tensorflow 训练了 word2vec,我想将这些结果输入到带有 lstm 单元的 rnn 中以进行序列标记。
1)目前还不清楚如何将训练有素的 word2vec 模型用于 rnn。(如何提供结果?)
2)我没有找到太多关于如何实现序列标签 lstm 的文档。(我如何带入我的标签?)
有人可以为我指出如何开始这项任务的正确方向吗?
我已经设法用 tensorflow 训练了 word2vec,我想将这些结果输入到带有 lstm 单元的 rnn 中以进行序列标记。
1)目前还不清楚如何将训练有素的 word2vec 模型用于 rnn。(如何提供结果?)
2)我没有找到太多关于如何实现序列标签 lstm 的文档。(我如何带入我的标签?)
有人可以为我指出如何开始这项任务的正确方向吗?
我意识到这是不久前发布的,但我发现这个关于序列标记的 Gist和这个关于可变序列标记的 Gist对弄清楚序列标记非常有帮助。基本大纲(Gist of the Gist):
dynamic_rnn
处理展开网络以进行训练和预测。这个方法已经在 API 中移动了一些,所以你可能需要为你的版本找到它,但只需谷歌它。[batch_size, sequence_length, num_features]
,将标签按大小排列[batch_size, sequence_length, num_classes]
。请注意,您希望序列中的每个时间步都有一个标签。sequence_length
的包装器参数。dynamic_rnn
还有一些注意事项:
tf.train.AdamOptimizer
首先使用默认设置。根据您的数据,这可能不会收敛,您需要调整设置。这篇文章很好地解释了不同旋钮的作用。从头开始阅读,在亚当部分之前解释了一些旋钮。希望这些链接将来对其他人有所帮助!