autoencoder - 使用自动编码器与变分自动编码器生成图像

Question

当我们使用卷积自编码器生成新图像时，模型是否每次运行模型都会生成相同的图像？还是更愿意生成随机变化的图像？我认为每次我们运行模型时，自动编码器 (AE) 都会生成相同的新图像，因为它将输入图像映射到潜在空间中的单个点。另一方面，变分自动编码器 (VAE) 将输入图像映射到一个分布。因此，如果我们需要一些随机变化的图像，我们需要使用 VAE，如果我们每次运行模型都需要相同的生成图像，我们使用 AE。这是真的？我的问题是：AE 会生成随机变化的图像吗？

score 0 · Accepted Answer

自编码器首先将输入数据编码为一些潜在的表示，然后使用该表示（瓶颈层）来重建相同的输入。我在 MNIST 数据上训练了一个自动编码器，并将数字编码成一个二维向量。网络对我绘制的数据进行了非常有用的表示。 MNIST 数字的潜在表示

您可以看到，对于每个数字，潜在表示具有一定范围的值，例如零的潜在表示在 x 轴上的范围几乎为 -2 到 4，在 y 轴上的范围为 4 到 8。现在，如果您在该范围内采样一个随机二维随机向量并通过解码器运行它，您将得到一个零随机图像。现在的问题是这是一个非常简单的案例。潜在向量有 64 维甚至更高，并且类别也更多。在这种情况下，我们需要对潜在向量的分布进行建模，以便对有效向量进行采样。否则，我们永远不会知道哪个潜在向量是有效的。所以自动编码器可能会给出随机样本，但它需要知道数据的分布以及我们在 VAE 中涵盖的那个点。

autoencoder - 使用自动编码器与变分自动编码器生成图像

1 回答 1

Related

Reference