6

我正在尝试实现一个降噪自动编码器,其间有一个 LSTM 层。架构如下。

FC layer -> FC layer -> LSTM cell -> FC layer -> FC layer.

我无法理解我的输入维度应该如何实现这个架构?

我尝试了以下代码

batch_size = 1
model = Sequential()
model.add(Dense(5, input_shape=(1,)))
model.add(Dense(10))
model.add(LSTM(32))
model.add(Dropout(0.3))
model.add(Dense(5))
model.add(Dense(1))
model.compile(loss='mean_squared_error', optimizer='adam')
model.fit(trainX, trainY, nb_epoch=100, batch_size=batch_size, verbose=2)

我的 trainX 是 [650,20,1] 向量。它是一个时间序列数据,只有一个特征。

我收到以下错误

ValueError                                Traceback (most recent call last)
<ipython-input-20-1248a33f6518> in <module>()
      3 model.add(Dense(5, input_shape=(1,)))
      4 model.add(Dense(10))
----> 5 model.add(LSTM(32))
      6 model.add(Dropout(0.3))
      7 model.add(Dense(5))

/usr/local/lib/python2.7/dist-packages/keras/models.pyc in add(self, layer)
    330                  output_shapes=[self.outputs[0]._keras_shape])
    331         else:
--> 332             output_tensor = layer(self.outputs[0])
    333             if isinstance(output_tensor, list):
    334                 raise TypeError('All layers in a Sequential model '

/usr/local/lib/python2.7/dist-packages/keras/engine/topology.pyc in __call__(self, x, mask)
    527             # Raise exceptions in case the input is not compatible
    528             # with the input_spec specified in the layer constructor.
--> 529             self.assert_input_compatibility(x)
    530 
    531             # Collect input shapes to build layer.

/usr/local/lib/python2.7/dist-packages/keras/engine/topology.pyc in assert_input_compatibility(self, input)
    467                                          self.name + ': expected ndim=' +
    468                                          str(spec.ndim) + ', found ndim=' +
--> 469                                          str(K.ndim(x)))
    470             if spec.dtype is not None:
    471                 if K.dtype(x) != spec.dtype:

ValueError: Input 0 is incompatible with layer lstm_10: expected ndim=3, found ndim=2
4

2 回答 2

8

密集层可以将序列作为输入,它将在每个向量(最后一维)上应用相同的密集层。例子 :

您有一个表示序列的 2D 张量输入(timesteps, dim_features),如果您使用 new_dim 输出对其应用密集层,则该层之后的张量将是一个新序列(timesteps, new_dim)

如果您有一个(n_lines, n_words, embedding_dim)可以是文档的 3D 张量,其中包含n_lines行、n_words每行单词和embedding_dim每个单词的维度,则使用 new_dim 输出对其应用密集层将为您提供具有形状的新文档张量 (3D)(n_lines, n_words, new_dim)

您可以在此处查看可以通过 Dense() 层输入和获取的维度输入和输出。

于 2017-03-10T10:58:26.800 回答
0

虽然 Nassim Ben 已经解释了背景,但由于 Google 把我带到这里,我想提一下tensorflow.keras.Layers.Reshape layer

我最初来自“如何实现辍学”的观点,但遇到了同样的问题。

尽管不同的 Layer 类(可能)已经嵌入了它们自己的 dropout-options,但我喜欢在它们tensorflow.keras.Layers.Dropout之间有我自己的、单独的挤压(因为它有助于我弱小的头脑跟踪它们)。

model.add(Reshape((1, Xtrain1.shape[1])))

现在又在表格的层之间挤压Dropout(或Dense就此而言)LSTM,并且至少我说服自己,有一个解决方案将不同层与张量维度的不同要求联系在一起。

于 2020-07-30T08:06:00.793 回答