9

我有一个关于使用我比较陌生的 Keras 的问题。我正在使用卷积神经网络,将其结果输入标准感知器层,然后生成我的输出。这个 CNN 输入了一系列图像。到目前为止,这很正常。

现在我喜欢将一个短的非图像输入向量直接传递到最后一个感知器层,而不是通过所有的 CNN 层发送。如何在 Keras 中做到这一点?

我的代码如下所示:

# last CNN layer before perceptron layer
model.add(Convolution2D(200, 2, 2, border_mode='same'))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2), strides=(2, 2)))
model.add(Dropout(0.25))

# perceptron layer
model.add(Flatten())

# here I like to add to the input from the CNN an additional vector directly

model.add(Dense(1500, W_regularizer=l2(1e-3)))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(1))

任何答案都非常感谢,谢谢!

4

3 回答 3

6

您没有向我展示您使用哪种模型,但我假设您将模型初始化为Sequential. 在一个Sequential模型中,你只能一层一层地堆叠——所以添加一个“捷径”连接是不可能的。

出于这个原因,Keras 的作者添加了构建“图形”模型的选项。在这种情况下,您可以构建计算图 (DAG)。这比设计一堆层更复杂,但仍然很容易。

检查文档站点以查找更多详细信息。

于 2016-02-25T23:11:52.233 回答
4

如果您的 Keras 的后端是 Theano,您可以执行以下操作:

import theano
import numpy as np

d = Dense(1500, W_regularizer=l2(1e-3), activation='relu') # I've joined activation and dense layers, based on assumption you might be interested in post-activation values
model.add(d)
model.add(Dropout(0.5))
model.add(Dense(1))

c = theano.function([d.get_input(train=False)], d.get_output(train=False))
layer_input_data = np.random.random((1,20000)).astype('float32') # refer to d.input_shape to get proper dimensions of layer's input, in my case it was (None, 20000)
o = c(layer_input_data)
于 2016-02-24T10:17:18.213 回答
1

这里的答案有效。它更高级别,也适用于tensorflow后端:

input_1 = Input(input_shape)
input_2 = Input(input_shape)

merge = merge([input_1, input_2], mode="concat")  # could also to "sum", "dot", etc.
hidden = Dense(hidden_dims)(merge)
classify = Dense(output_dims, activation="softmax")(hidden)

model = Model(input=[input_1, input_2], output=hidden)
于 2018-02-21T16:46:55.637 回答