3

特别是,我对 LSTM 层拥有(比如说)50 个单元意味着什么感到困惑。考虑这篇很棒的博客文章中的以下 LSTM 块:

来自 http://colah.github.io/posts/2015-08-Understanding-LSTMs/ 的 LSTM 模型

假设我的输入xt是一个(20,)向量,隐藏层ht是一个(50,)向量。鉴于细胞状态在成为新的隐藏状态之前Ct只经历了逐点操作(逐点tanh*),我认为Ct.shape = ht.shape = (50,). 现在遗忘门查看与隐藏层连接的输入,这将是一个(20+50,) = (70,)向量,这意味着遗忘门必须有一个形状为 的权重矩阵(50, 70),例如dot(W, [xt, ht]).shape = (50,)

所以我现在的问题是,我在看一个有 50 个单元的 LSTM 块什么时候Ct.shape = (50,)?还是我误解了 LSTM 层有 50 个单元的含义?

4

1 回答 1

4

我明白你对什么感到困惑。所以基本上,连接顶部两个框的黑线表示细胞状态,实际上是一组非常小的 50 条线组合在一起。这些与遗忘门的输出逐点相乘,遗忘门的输出由 50 个值组成。这 50 个值与单元状态点相乘。

于 2015-10-26T14:50:36.097 回答