1

我正在尝试在 keras 中实现对抗性损失。该模型由两个网络组成,一个自动编码器(目标模型)和一个鉴别器。这两个模型共享编码器。

我通过设置 keras 变量创建了自动编码器的对抗性损失

def get_adv_loss(d_loss):
    def loss(y_true, y_pred):
        return some_loss(y_true, y_pred) - d_loss
    return loss

discriminator_loss = K.variable()
L = get_adv_loss(discriminator_loss)
autoencoder.compile(..., loss=L)

在训练期间,我train_on_batch交错discriminatorautoencoder更新discriminator_loss

d_loss = disciminator.train_on_batch(x, y_domain)
discriminator_loss.assign(d_loss)
a_loss, ... = self.segmenter.train_on_batch(x, y_target)

但是,我发现在编译模型时这些变量的值被冻结了。我试图在训练期间重新编译模型,但这会引发错误

节点“IsVariableInitialized_13644”:未知输入节点“training_12/Adam/Variable”

我想这意味着我不能在训练期间重新编译?关于如何在自动编码器中注入鉴别器损失的任何建议?

4

2 回答 2

0

除非您决定深入研究 keras 源代码,否则我认为您不能轻易做到这一点。在编写自己的对抗模块之前,您应该仔细检查现有作品。据我所知,keras-adversarial仍然被很多人使用。当然,它只支持旧的 keras 版本,例如 2.0.8。

其他几件事:

  1. 冻结模型重量时要小心。如果你先编译一个模型,然后冻结一些权重,这些权重仍然是可训练的,因为在编译过程中会生成训练函数。所以你应该先冻结权重然后编译。
  2. keras-adversarial以更优雅的方式完成这项工作。它没有创建两个模型,共享权重但以不同的方式冻结一些权重,而是创建了两个训练函数,每个玩家一个。
于 2018-08-29T05:12:25.520 回答
0

Keras 模型支持多个输出。因此,如果不应该训练鉴别器,只需将鉴别器包含到您的 keras 模型中并冻结鉴别器层。

下一个问题是如何结合自动编码器损失和鉴别器损失。幸运的是 keras model.compile支持损失权重。如果自动编码器是您的第一个输出,而鉴别器是您的第二个输出,您可以执行类似loss_weights=[1, -1]. 因此,更好的鉴别器对自动编码器来说更糟。

编辑:这是一个示例,如何实现对抗网络:

# Build your architecture
auto_encoder_input = Input((5,))
auto_encoder_net = Dense(10)(auto_encoder_input)
auto_encoder_output = Dense(5)(auto_encoder_net)

discriminator_net = Dense(20)(auto_encoder_output)
discriminator_output = Dense(5)(discriminator_net)

# Define outputs of your model
train_autoencoder_model = Model(auto_encoder_input, [auto_encoder_output, discriminator_output])
train_discriminator_model = Model(auto_encoder_input, discriminator_output)

# Compile the models (compile the first model and then change the trainable attribute for the second)
for layer_index, layer in enumerate(train_autoencoder_model.layers):
    layer.trainable = layer_index < 3

train_autoencoder_model.compile('Adam', loss=['mse', 'mse'], loss_weights=[1, -1])        

for layer_index, layer in enumerate(train_discriminator_model.layers):
    layer.trainable = layer_index >= 3

train_discriminator_model.compile('Adam', loss='mse')

# A simple example how a training can look like
for i in range(10):
    auto_input = np.random.sample((10,5))
    discrimi_output = np.random.sample((10,5))
    train_discriminator_model.fit(auto_input, discrimi_output, steps_per_epoch=5, epochs=1)
    train_autoencoder_model.fit(auto_input, [auto_input, discrimi_output], steps_per_epoch=1, epochs=1)  

如您所见,使用 keras 构建对抗模型并没有什么神奇之处。

于 2018-08-28T11:20:48.243 回答