4

在 GAN 框架中,生成器会违反图像中未明确表示的真实分布的硬约束并不少见,例如,狗很少有超过一个头或 4 条腿。

鉴于没有头或腿计数神经元,并且人们对使用领域知识来挖掘这些规范并将它们用作判别器的输入不感兴趣,有什么方法可以在 GAN 或约束的上下文中挖掘和执行这些规范优化问题。

在我自己的例子中,数据由钢琴卷组成,即一个轴代表时间,T,另一个代表音符,N。规范的一些示例可能是:A)对于 T 中的每个 t,将只有一个正值 N,即每个时间步一个音符 B) 只有在 Note 轴上正值直接和间接邻居的计数等于或大于 2 时,才能存在正值 N。

例如

Invalid 
10110110 
11001101

Valid 
00000000 
11101111

非常欢迎建议或建议!控制低级图像特征的一个例子。 https://arxiv.org/pdf/1611.07865.pdf

4

0 回答 0