我最近正在研究 GAN 模型,并认为它对我的系统很有用,我将在该系统中预测给定图像是否是汽车。我理解“鉴别器”从“生成器”获取输入的部分。生成器从随机向量生成图像,然后将其传递给鉴别器进行真实性检查。但是生成器使用的向量到底是什么?它是否在转换为像素的图像中,我们将其作为像素向量传递?
谁能给我解释一下
或者我应该遵循任何其他方法来构建一个可以将图像分类为汽车的系统
提前致谢
我最近正在研究 GAN 模型,并认为它对我的系统很有用,我将在该系统中预测给定图像是否是汽车。我理解“鉴别器”从“生成器”获取输入的部分。生成器从随机向量生成图像,然后将其传递给鉴别器进行真实性检查。但是生成器使用的向量到底是什么?它是否在转换为像素的图像中,我们将其作为像素向量传递?
谁能给我解释一下
或者我应该遵循任何其他方法来构建一个可以将图像分类为汽车的系统
提前致谢
生成器的输入是完全随机值的 z 维向量。在 DCGAN 的情况下,输入来自高斯分布源。GAN 的理论基于这样一个事实,即这些随机值被学习到被网络以这样一种方式扭曲,即鉴别器/批评者被生成器产生的图像所愚弄。生成器和判别器都是彼此的对手,使彼此在每个时代都变得更好,因此得名对抗网络。
为了将图像分类为汽车而不是汽车,您实际上可以使用简单的 ConvNet 通过在多个汽车图像和“非汽车”图像上进行训练来相当容易且准确地解决这个问题。已经有相当复杂的对象检测网络在 Imagenet 数据上进行了训练,因此您不妨从参考这些网络的架构开始。
希望我的回答对你有所帮助。:)