在我的 tensorflow CNN 的第一轮,损失变成了 NAN。
1. 网络:
3个隐藏层(2个卷积层+1个隐藏全连接层)+读出层。
2. 3个隐藏层:
a) 重量:
W = tf.Variable(tf.truncated_normal(wt,stddev=0.1,name='wights' ))
b) 偏差:
b = tf.Variable( tf.fill([W.get_shape().as_list()[-1] ],0.9),name = 'biases' )
c) 活动:
ReLu
d) 辍学:
0.6
**即使 dropout 为 0.0,损失也会变为 nan
3. 读出层:
softmax
4:损失函数:
tf.reduce_mean(-tf.reduce_sum(_lables * tf.log(_logist), reduction_indices=[1]))
5.优化器:
tf.train.AdamOptimizer
learning_rate = 0.0005
**即使 learning_rate = 0,损失也会变成 nan