5

在 TensorFlow 中,我可以通过两种方式初始化变量:

  1. global_variable_intializer()在声明变量之前调用:

    import tensorflow as tf
    
    # Initialize the global variable and session
    init = tf.global_variables_initializer()
    sess = tf.Session()
    sess.run(init)
    
    W = tf.Variable([.3], tf.float32)
    x = tf.Variable([-.3], tf.float32)
    b = tf.Variable([-.3], tf.float32)
    linear_model = W * x + b
    
  2. global_variable_intializer()变量声明后调用:

    import tensorflow as tf
    
    W = tf.Variable([.3], tf.float32)
    x = tf.Variable([-.3], tf.float32)
    b = tf.Variable([-.3], tf.float32)
    linear_model = W * x + b 
    
    # Initialize the global variable and session
    init = tf.global_variables_initializer()
    sess = tf.Session()
    sess.run(init)
    

两者有什么区别?初始化变量的最佳方法是什么?

编辑

这是我正在运行的实际程序:

import tensorflow as tf

# Initialize the global variable and session
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

W = tf.Variable([.3], tf.float32)
b = tf.Variable([-.3], tf.float32)

x = tf.placeholder(tf.float32)
y = tf.placeholder(tf.float32)



linear_model = W * x + b

square_delta = tf.square(linear_model - y)

loss = tf.reduce_sum(square_delta)

fixW = tf.assign(W, [-1.])
fixb = tf.assign(b, [1.])

sess.run([fixW, fixb])

print(sess.run(loss, {x:[1,2,3,4], y:[0,-1,-2,-3]}))
4

3 回答 3

6

在情况1中,变量没有初始化,如果你尝试

sess.run(linear_model)

它应该给你某种错误(我的编译器上的 FailedPreconditionError)。

案例2是有效的。

命令

tf.global_variables_initializer()

应在创建所有变量后调用,否则将引发相同的错误。

据我了解,每次调用 tf.Variable 时,都会将与变量相关的节点添加到图中。这些是:

Variable/initial_value
Variable
Variable/Assign
Variable/read

(您使用命令获取到目前为止构建的节点

for n in tf.get_default_graph().as_graph_def().node:
    print n.name

)

变量本身没有任何价值,直到您在 Session 中运行 Variable/Assign 节点。

命令

init = tf.global_variables_initializer() 

创建一个包含迄今为止构建的所有变量的所有分配节点的单个节点,并将其与 python 变量“init”相关联,以便在执行该行时

sess.run(init)

所有变量获取初始值。

于 2017-05-31T12:33:05.023 回答
2

两个选项之间的区别在于第一个选项不起作用。试图sess.run(linear_model)导致

FailedPreconditionError(参见上面的回溯):尝试使用未初始化的值 Variable_3

因此,不出所料,您应该在创建变量后对其进行初始化。

于 2017-05-31T12:23:40.433 回答
1

您应该将 Tensorflow 视为一个图表,其中包含:

W = tf.Variable([.3], tf.float32) b = tf.Variable([-.3], tf.float32) b = tf.Variable([-.3], tf.float32) linear_model = W * x + b

您只是在描述您的张量流图。如果您打印 linear_model 您将有一个没有值的张量等待图形运行:<tf.Tensor 'add:0' shape=(1,) dtype=float32>

Tensorflow 将运行您的图表并“导出”仅在运行会话时您想要的值my value = sess.run(linear_model)

这就是为什么你应该考虑你的第二个解决方案!

于 2017-05-31T12:30:22.223 回答