-1

线性插值经常与具有单位方差和零均值的高斯或均匀先验一起使用,其中向量的大小可以以任意方式定义,例如 100,以便为生成对抗神经 (GAN) 中的生成器模型生成初始随机向量。

假设我们有 1000 张图像用于训练,批量大小为 64。那么每个时期,需要使用与给定小批量的每个图像相对应的先验分布生成多个随机向量。但是我看到的问题是,由于随机向量和对应的图像之间没有映射关系,所以可以使用多个初始随机向量生成同一张图像。在本文中,它建议在一定程度上通过使用不同的球面插值来克服这个问题。

那么,如果最初生成与训练图像数量相对应的随机向量,并且在训练模型时使用最初生成的相同随机向量,会发生什么?

4

1 回答 1

1

在 GAN 中,用作输入的随机种子实际上并不对应于任何真实的输入图像。GAN 实际上做的是学习从已知噪声分布(例如高斯分布)到复杂未知分布的转换函数,该分布由 iid 样本(例如您的训练集)表示。GAN 中的判别器所做的是计算生成数据(例如转换后的高斯)和真实数据(您的训练数据)之间的散度(例如 Wasserstein 散度、KL 散度等)。这是以随机方式完成的,因此真实数据和虚假数据之间没有必要的联系。如果您想通过实例了解更多相关信息,我可以建议您进行训练以训练 Wasserstein GAN,以将一个 1D 高斯分布转换为另一个。

无论如何,你的论文试图告诉你的是在你训练了你的 GAN 之后,并想看看它是如何将生成的数据从已知噪声空间映射到未知图像空间的。出于这个原因,已经发明了插值方案,就像您引用的球形方案一样。他们还表明,GAN 已经学会将潜在空间的某些部分映射到图像中的关键特征,例如微笑。但这与 GAN 的训练无关。

于 2018-05-23T10:15:25.963 回答