0

我正在尝试为一个项目构建一个 GAN,我真的很想了解这个在 tensorflow 的 variable_scope 中共享的变量是如何工作的。

为了构建 GAN,我有一个生成器网络和两个鉴别器网络:一个鉴别器输入真实图像,一个鉴别器输入由生成器创建的假图像。重要的是,输入真实图像的鉴别器和输入假图像的鉴别器需要共享相同的权重。为了做到这一点,我需要分享权重。

我有一个鉴别器和生成器定义,可以说:

def discriminator(images, reuse=False):
    with variable_scope("discriminator", reuse=reuse):

        #.... layer definitions, not important here
        #....
        logits = tf.layers.dense(X, 1)
        logits = tf.identity(logits, name="logits")
        out = tf.sigmoid(logits, name="out")
        # 14x14x64
    return logits, out

def generator(input_z, reuse=False):
    with variable_scope("generator", reuse=reuse):

        #.. not so important 
        out = tf.tanh(logits)

    return out

现在生成器和鉴别器函数被调用:

g_model = generator(input_z)
d_model_real, d_logits_real = discriminator(input_real)

#Here , reuse=True should produce the weight sharing between d_model_real, d_logits_real
#and d_model_fake and d_logits_fake.. why?
d_model_fake, d_logits_fake = discriminator(g_model, reuse=True)

为什么第二次调用中的 reuse=True 语句会产生权重共享?据我了解,您需要决定在第一次调用中重用变量,以便您可以稍后在程序中的某个地方使用它们。

如果有人可以向我解释这一点,我会非常高兴,我找不到这个话题的好来源,而且对我来说似乎真的很混乱和复杂。谢谢!

4

1 回答 1

3

在引擎盖下,变量是使用创建的tf.get_variable()

此函数将在变量名称前加上作用域,并在创建新变量之前检查它是否存在。

例如,如果您在范围内"fc"并调用tf.get_variable("w", [10,10]),则变量名称将为"fc/w:0".

现在,当您第二次执行此操作时, if reuse=True,范围将再次变为"fc"get_variable 将重用 variable "fc/w:0"

但是,如果reuse=False,您将收到一个错误,因为该变量"fc/w:0"已经存在,提示您使用不同的名称或使用reuse=True.

例子:

In [1]: import tensorflow as tf

In [2]: with tf.variable_scope("fc"):
   ...:      v = tf.get_variable("w", [10,10])
   ...:

In [3]: v
Out[3]: <tf.Variable 'fc/w:0' shape=(10, 10) dtype=float32_ref>

In [4]: with tf.variable_scope("fc"):
   ...:      v = tf.get_variable("w", [10,10])
   ...:
ValueError: Variable fc/w already exists, disallowed. Did you mean to set reuse=True or reuse=tf.AUTO_REUSE in VarScope?

In [5]: with tf.variable_scope("fc", reuse=True):
   ...:      v = tf.get_variable("w", [10,10])
   ...:

In [6]: v
Out[6]: <tf.Variable 'fc/w:0' shape=(10, 10) dtype=float32_ref>

请注意,您可以只实例化一个鉴别器,而不是共享权重。然后,您可以决定使用 placeholder_with_default 为其提供真实数据或生成的数据。

于 2018-06-22T16:33:30.040 回答