1

处理图像翻译问题。有很多对输入-输出图像,比如说草图作为输入,翻译草图作为输出。图像是黑白的,带有 1 像素宽度的草图线。

可以使用简单的编码器-解码器来学习图像翻译吗?

下面的代码片段来自https://blog.keras.io/building-autoencoders-in-keras.html,它显示了自动编码器的编程方式。显然,作为自动编码器,输入和输出都显示相同。

autoencoder.fit(x_train, x_train,
                epochs=50,
                batch_size=256,
                shuffle=True,
                validation_data=(x_test, x_test))

但是在这里,我可以给出“x_train,y_train”而不是“x_train,xtrain”作为前两个参数,其中 x_train 是输入图像,y_train 是输出图像?

理论上是正确的吗?以下优化器和成本函数会起作用吗?

autoencoder.compile(optimizer='adadelta', loss='binary_crossentropy')

通常 Pix2Pix 网络用于此类工作。但是 GAN 的主要原则是他们学习成本函数以获得良好的输出。

在我的问题中,成本函数是非常确定的,而不是到处都有一个像素。因此可以清楚地定义错误。

甚至在这里尝试 Pix2Pix 在理论上是否正确?

4

0 回答 0