5

我使用 VGG 16-Layer Caffe 模型作为图像说明,每张图像有几个说明。现在,我想从这些标题(单词)中生成一个句子。
我在一篇关于 LSTM 的论文中读到,我应该从训练网络中移除 SoftMax 层,并将层中的 4096 特征向量fc7直接提供给 LSTM。
我是 LSTM 和 RNN 的新手。
我应该从哪里开始?是否有任何教程显示如何通过序列标签生成句子?

4

1 回答 1

4

AFAIK BVLC/caffe 的主分支还不支持循环层架构。

你应该recurrentjeffdonahue/caffe拉分支。该分支支持 RNN 和 LSTM。
它还包含有关如何生成使用MS COCO数据训练的图像说明的详细示例。

于 2015-12-28T13:59:55.933 回答