我正在研究 DCGAN,我想知道一些关于它的事情。
在 Ian Goodfellow 的自然 GAN 中,判别器模型输出一个标量值,即概率。但 DCGAN 的判别器采用 CNN 架构设计。我知道 CNN 的输出是类概率向量。
那么鉴别器是如何在 DCGAN 上工作的呢?DCGAN 的判别器的输出是什么?
我正在研究 DCGAN,我想知道一些关于它的事情。
在 Ian Goodfellow 的自然 GAN 中,判别器模型输出一个标量值,即概率。但 DCGAN 的判别器采用 CNN 架构设计。我知道 CNN 的输出是类概率向量。
那么鉴别器是如何在 DCGAN 上工作的呢?DCGAN 的判别器的输出是什么?
有关详细答案,请参阅TensorFlow 中的深度学习图像补全。
简而言之:假设你制作了一个 CNN,它有 n 个输入和有效填充大小的过滤器。然后输出的形状将是 nx 1 x 1。然后您可以将 softmax 应用于该形状,并且您将获得通道中的概率。
您可能还想阅读2.2.1。我硕士论文的卷积层。
判别器D采用 3x64x64(例如)输入图像,通过一系列 Conv2d、BatchNorm2d 和 LeakyReLU 层对其进行处理,并通过 Sigmoid 激活函数输出最终概率。
让我们看一个示例代码来了解它的输入和输出。
class Discriminator(nn.Module):
def __init__(self, ngpu):
super(Discriminator, self).__init__()
self.ngpu = ngpu
self.main = nn.Sequential(
nn.Conv2d(nc, ndf, 4, 2, 1, bias=False),
nn.LeakyReLU(0.2, inplace=True),
nn.Conv2d(ndf, ndf*2, 4, 2, 1, bias=False),
nn.BatchNorm2d(ndf*2),
nn.LeakyReLU(0.2, inplace=True),
nn.Conv2d(ndf*2, ndf*4, 4, 2, 1, bias=False),
nn.BatchNorm2d(ndf*4),
nn.LeakyReLU(0.2, inplace=True),
nn.Conv2d(ndf*4, ndf*8, 4, 2, 1, bias=False ),
nn.BatchNorm2d(ndf*8),
nn.LeakyReLU(0.2, inplace=True),
nn.Conv2d(ndf*8, 1, 4, 1, 0, bias=False),
nn.Sigmoid()
)
def forward(self, input):
return self.main(input)
欲了解更多详情,请访问此处