python - 在 TensorFlow 中初始化变量的最佳方法是什么？

Question

在 TensorFlow 中，我可以通过两种方式初始化变量：

global_variable_intializer()在声明变量之前调用：

import tensorflow as tf

# Initialize the global variable and session
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

W = tf.Variable([.3], tf.float32)
x = tf.Variable([-.3], tf.float32)
b = tf.Variable([-.3], tf.float32)
linear_model = W * x + b

global_variable_intializer()变量声明后调用：

import tensorflow as tf

W = tf.Variable([.3], tf.float32)
x = tf.Variable([-.3], tf.float32)
b = tf.Variable([-.3], tf.float32)
linear_model = W * x + b 

# Initialize the global variable and session
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

两者有什么区别？初始化变量的最佳方法是什么？

编辑

这是我正在运行的实际程序：

import tensorflow as tf

# Initialize the global variable and session
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

W = tf.Variable([.3], tf.float32)
b = tf.Variable([-.3], tf.float32)

x = tf.placeholder(tf.float32)
y = tf.placeholder(tf.float32)



linear_model = W * x + b

square_delta = tf.square(linear_model - y)

loss = tf.reduce_sum(square_delta)

fixW = tf.assign(W, [-1.])
fixb = tf.assign(b, [1.])

sess.run([fixW, fixb])

print(sess.run(loss, {x:[1,2,3,4], y:[0,-1,-2,-3]}))

score 6 · Accepted Answer

在情况1中，变量没有初始化，如果你尝试

sess.run(linear_model)

它应该给你某种错误（我的编译器上的 FailedPreconditionError）。

案例2是有效的。

命令

tf.global_variables_initializer()

应在创建所有变量后调用，否则将引发相同的错误。

据我了解，每次调用 tf.Variable 时，都会将与变量相关的节点添加到图中。这些是：

Variable/initial_value
Variable
Variable/Assign
Variable/read

（您使用命令获取到目前为止构建的节点

for n in tf.get_default_graph().as_graph_def().node:
    print n.name

)

变量本身没有任何价值，直到您在 Session 中运行 Variable/Assign 节点。

命令

init = tf.global_variables_initializer()

创建一个包含迄今为止构建的所有变量的所有分配节点的单个节点，并将其与 python 变量“init”相关联，以便在执行该行时

sess.run(init)

所有变量获取初始值。

score 2 · Accepted Answer

两个选项之间的区别在于第一个选项不起作用。试图sess.run(linear_model)导致

FailedPreconditionError（参见上面的回溯）：尝试使用未初始化的值 Variable_3

因此，不出所料，您应该在创建变量后对其进行初始化。

score 1 · Accepted Answer

您应该将 Tensorflow 视为一个图表，其中包含：

W = tf.Variable([.3], tf.float32) b = tf.Variable([-.3], tf.float32) b = tf.Variable([-.3], tf.float32) linear_model = W * x + b

您只是在描述您的张量流图。如果您打印 linear_model 您将有一个没有值的张量等待图形运行：<tf.Tensor 'add:0' shape=(1,) dtype=float32>

Tensorflow 将运行您的图表并“导出”仅在运行会话时您想要的值my value = sess.run(linear_model)

这就是为什么你应该考虑你的第二个解决方案！

python - 在 TensorFlow 中初始化变量的最佳方法是什么？

3 回答 3

Related

Reference