为什么 Graves-LSTM 层 Cell 有 11 个权重,它们的目的是什么?
给出下面的例子可以生成权重列表:
MultiLayerNetwork model = new MultiLayerNetwork(new NeuralNetConfiguration.Builder()
.list()
.layer(0, new GravesLSTM.Builder()
.nIn(1)
.nOut(1)
.activation("sigmoid")
.weightInit(WeightInit.ZERO)
.build()
)
.build());
model.init();
System.out.println("Weigths: " + model.paramTable());
出去:
重量:
{0_W=[0.00, 0.00, 0.00, 0.00], 0_RW=[0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00], 0_b=[0.00, 1.00, 0.00, 0.00]}
(11 权重 + 4 偏差)
相比之下,这里是使用 DenseLayer而不是 GravesLSTM 的输出:
权重:{0_W=0.00, 0_b=0.00}
(1 个权重 + 1 个偏差,这很清楚。)