这是我想做的:
我想使用一些迁移学习技术来处理序列问题:首先使用 dataset_1 训练一个 lstm 模型,然后在输出层之前插入另一个 lstm 层,然后使用 dataset_2 只训练新添加的层,其他的变量层从第一个训练阶段导入并保持不变
这就是问题所在,现有的方法在恢复预训练模型时都需要权重/偏差的变量名。而且我想tf.contrib.rnn.MultiRNNCell(*)
在我的代码中使用该功能。但是,该功能是一个黑匣子,无法获得具体的变量名称。我怎样才能实现这个想法?
这是我想做的:
我想使用一些迁移学习技术来处理序列问题:首先使用 dataset_1 训练一个 lstm 模型,然后在输出层之前插入另一个 lstm 层,然后使用 dataset_2 只训练新添加的层,其他的变量层从第一个训练阶段导入并保持不变
这就是问题所在,现有的方法在恢复预训练模型时都需要权重/偏差的变量名。而且我想tf.contrib.rnn.MultiRNNCell(*)
在我的代码中使用该功能。但是,该功能是一个黑匣子,无法获得具体的变量名称。我怎样才能实现这个想法?