5

当我使用 Keras 运行此代码时:

networkDrive = Input(batch_shape=(1,length,1))
network = SimpleRNN(3, activation='tanh', stateful=False, return_sequences=True)(networkDrive)

generatorNetwork = Model(networkDrive, network)

predictions = generatorNetwork.predict(noInput, batch_size=length)


print(np.array(generatorNetwork.layers[1].get_weights()))

我得到这个输出

[array([[ 0.91814435,  0.2490257 ,  1.09242284]], dtype=float32)
 array([[-0.42028981,  0.68996912, -0.58932084],
       [-0.88647962, -0.17359462,  0.42897415],
       [ 0.19367599,  0.70271438,  0.68460363]], dtype=float32)
 array([ 0.,  0.,  0.], dtype=float32)]

我想,(3,3) 矩阵是权重矩阵,将 RNN 单元相互连接起来,两个数组之一可能是偏差但是第三个是什么?

4

1 回答 1

3

在 simpleRNN 实现中,确实需要 3 组权重。

weights[0]是输入矩阵。它转换输入,因此具有形状[input_dim, output_dim]

weights[1]是递归矩阵。它转换循环状态并具有形状[output_dim, output_dim]

weights[2]是偏置矩阵。它被添加到输出中并具有形状[output_dim]

将三个操作的结果相加,然后通过激活层。

我希望这现在更清楚了吗?

于 2017-07-14T09:48:29.537 回答